资源预览内容
第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
亲,该文档总共3页全部预览完了,如果喜欢就下载吧!
资源描述
Google-“AK47”的制造者:阿米特辛格博士 在所有的轻武器中,AK47 冲锋枪得益于其从不卡壳、从不损坏、可在任何环境下使用、 可靠性好、杀伤力大并且操作简单等特点,最为闻名。 同理,在计算机中一个好的算法, 理应简单、有效、可靠性好而且易操作,而不应故弄玄虚。 在算法设计上,我们不应该 成为完美主义者,有时简单有效的方法更能切合实际,而且很多时候简单方案有利于系统 查错。 简单有效的解决方案,并不是凭直觉,这常常是深思熟虑去伪存真的结果。 同 时辛格博士还鼓励年轻人要大胆地不断尝试,正如波普尔在证伪主义中提及的科学发展: P1(问题)TT(尝试性的理论)EE(排除错误)P2(问题) 。此外,辛格博士不满足 于做实验和写论文,于是他毅然决然地离开了 AT&T 实验室,来到了尚未成型的 Goolge。 从中我觉得,要想成为新时期国家发展的建设者,我们应该有自身的追求,在获得在现实 社会中得以生存的必需品后,我们应该坚持自己的远大理想。不要抱怨现实生活中的种种, 只有对理想、对信念的坚持才能使我们变为思想上的强者。更深一层,我们应该从钱学森 老先生的事迹中,领会到:科学技术与艺术的结合往往能催生更大的成就!正如胡锦涛书 记在十八大会议中提到的建设“美丽中国”这一建设性意见。自然语言处理的教父:马库斯 强将手下无弱兵,几乎每一个伟大学生的背后都必然会有一个伟大的老师。马库斯就 是这样的导师。马库斯高瞻远瞩地意识到语料库的重要性, 给予博士生研究自己感兴趣 课题的自由,甚至让博士生提出自己有意愿想研究的课题。当然这并不是盲目地放养状态, 马库斯高屋建瓴,能凭借多年的专业经验,很快地判断一个研究方向是否正确。从而,他 的弟子也得益于此,节省了许多 try-and-error 的时间,进而能够顺利较快地完成学业 除 了术业有专攻之外,真正的名家还应该对与自身研究领域相关的知识有所涉猎,并能提出 独到的见解 一个时代的牛人、一个领域的标杆,也会在人才培养上提出自己的见解。正 如马库斯在专业设置方面的贡献:当互联网蓬勃发展,许多高校开始陆续研究互联网时, 马库斯指出生物信息学的重要性,并在宾夕法利亚大学设置该专业,同时还建议学校相关 领域的教授将部分精力投入到生物信息学的研究中。正是由于马库斯卓识的远见,在其他 学校还未意识之际,就开始招兵买马,未雨绸缪。反观国内高校近几年的发展,我认为我 们迫切需要这样卓有远见的管理者。数学模型 金无赤足,人无完人。人的一生不可能在各个方面都追求完美,一个完美主义者所追 求的极致完美往往会给人带来窒息的感觉。托勒密创立了天文学,发明了球坐标,定义了 含赤道和零度经线在内的经纬线,提出黄道和弧度制。同时,他结合四十个小圆套大圆的 方法提出地心说,并精确地计算出所有行星运动的轨迹。然而,地心说这一发明却引来颇 多争议,最后被证实为伪命题。但是,这并不影响托勒密的伟大。换个角度来看待,可能 正是由于托勒密地心说的提出,才让人们开始关心天文学这一领域,进而引发人们对地心 说的怀疑,以此推动天文学的发展与进步。 团队合作的重要性。一个理论的提出,并 不仅仅依靠于某一个人,这往往需要诸多研究者的齐心协力、共同付出。正如,从托勒密 的地心说哥白尼的日心说开普勒的椭圆轨道牛顿的万有引力亚当斯和维内尔的海 王星,这就像是一部舞台剧,一幕接着一幕地上演,只是不同场景出现不同的演员,不同 的演员演绎不一样的情节,但这里面无处不存在着连续性。 从开普勒成功中,我还挖掘 到另外两条成功的可能途径:选择一个好的导师,开普勒正是从第谷手中继承了大量的、 在当时最精确的数据;运气,开普勒幸运地发现行星围绕太阳运转的轨道实际为椭圆形。 虽然,常言道:好运总是偏向有准备的人,然而运气这种看不见、摸不着的东西,有时还就真的只能归结为运气。故而,多普勒的成功并不是可以简单复制的。要想成为某一方面 的强者,在某一领域做出杰出的贡献,我们还是必须脚踏实地,一步一个脚印,坚持不懈 地朝着目标进发。 数学模型好坏的评价标准: 1、 一个正确的数学模型应当在形式上简单; 2、 一个正确的数学模型在开始时可能不如一个精雕细琢过的错误的模型准确,但是 如果我们认定大方向正确,就应该坚持下去; 3、 大量准确的数据对研发很重要; 4、 正确的模型也可能受噪音干扰,而显得不那么准确:这时我们不应该用一种凑合 的修正方法来弥补它,而是要找到噪音的根源并加以分析。 上述的评价体系并不局限于衡量数学模型,同样,许多数学定理也可以依次做出评价。 正如,邓大萌老师在矩阵理论课堂上所提及的:任何一个得到广泛应用的定理,其约 束条件必然较少;换言之,任何一件事物的约束条件与该事物获得应用范围的大小成反比。 简单是一种美,美好东西的美妙之处恰恰蕴含于简简单单的事物中。下面举一个例子:试 图寻找简单得不能再简单的方法是艾里克布莱尔的研究策略。正是因为简单的理念,在 研究领域,虽然布莱尔有时不一定能马上找到如何解决问题的办法,但是他能马上否定掉 一种不可能的方案,并能在短时间内大致摸清每种方法的好坏。简单的方法,容易轻易地 被后来者超越,这就要求从业者孜孜不倦地辛勤工作 我们追求简单,是因为越是简单的事物越能在工业界获得更好地应用和发展。在学术 界,研究者们追求的是一种与简单相对立的状态,这就是“繁琐哲学” 。生活中总会遇到一 些学者,他们会将一个问题研究到极致,执着追求完善甚至完美。作为完美主义者,他们 克服了身体和心灵的双重压力,将事情做到极致。科研正是需要这样的人才,他们的工作、 他们的付出对同行和后来者有着极大的参考价值。在当今的互联网时代,Google 作为一家互联网公司取得了巨大的成功。作为当今互联 网领域领头羊的、家喻户晓的搜索引擎,Google 从 1998 年问世以来,在极短的时间内迅 速崛起,不仅超越了所有的竞争对手,而且彻底改变了整个互联网的生存状态。 正如每一个成功男人的背后都有一个默默付出的女人一样,Google 如此一家显赫公司 的背后,自然也暗含着许许多多的故事。综合考虑诸多的成功因素,层层剥开,不难发现 在 Google 成功背后起着举足轻重作用的正是数学。 Google 作为一个搜索引擎, 其核心功能便是网页搜索。Google 的使命是整合全球的 信息,Google 工作人员一直致力于研究如何让机器对信息、语言做最好的理解和处理。传 统的搜索具有:搜索对象的数量较小;搜索对象具有良好的分类和排序;搜索结果 的重复度较低。然而随着互联网的蓬勃发展,大量的数据信息涌现出来,一个数据信息时 代已经悄然来到。互联网的这些特点给搜索引擎的设计带来了极大的挑战。统计语言模型 数学是解决信息检索和自然语言处理的最好工具。数学能非常清晰地描述这些领域的 实际问题并且能给出漂亮的解决办法。隐含马尔可夫模型是这一数学模型,一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决。香农信息论: 何为信息?信息是个十分抽象的概念。一则消息所包含信息量的大小和它的不确定性 有直接的关系。为此,香农在 1948 年提出“信息熵”的概念,并用“比特”来实现信息的 量化度量。事件的不确定性越大,熵也就越大,把该事件弄清楚所需要的信息量也就越大。 有香农信息熵还引申出冗余度的概念,作为语言模型,不同语言的冗余度差别很大,其中 汉语具有相对较小的冗余度,这与汉语是最简洁的语言这一论断相吻合。布尔代数 二进制是世界上最简单的计数方法,布尔运算是世界上最简单的运算。作为一个搜索 引擎,应该实现:自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进 行公平准确的排序。现在我们广泛使用的各种搜索引擎,即使再智能化,也都没有摆脱布 尔运算的条条框框。布尔运算先后应用于实现开关电路、文件检索。对于互联网的搜索引 擎而言,每一个网页就是一个文献。互联网的网页数量是巨大的,网络中的用词也非常多, 因而索引大约是万亿字节的量级。布尔运算体现了其功能的强大,不管索引如何复杂,查 找的基本操作仍然是布尔运算。布尔运算把逻辑和数学联系起来,它易于实现、速度快的 特点,恰好适合于海量信息的查找。当然,真如硬币的两面性,布尔运算的不足在于只能 给出“是与否”的定性判断,而不能获得量化的度量。所以,所有搜索引擎在内部检索完 毕后,都需要对符合要求的网页依据相关性进行排序,进过排序后网页才能返回给用户。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号