数学之美:不能再凑了

在看吴军老师的数学之美之前,我已经开始意识到数学的重要性,前面写了一篇计算机中的数学。迫不及待的看完之后,收获巨大,特别是最后明白了吴军老师写作目的的时候,备受冲击。吴军老师希望我们做软件不要再凑了,而是从数学中找简洁的方法。

书中有好几个问题都讲的特别精彩。比如搜索问题。吴军老师在讲解问题的时候,更注重技术中的“术”的部分,所谓“术”,就是认识问题的角度,解决问题的思路。而“技”强调的是在找到方案之后,如何把方案付诸于实践。拿搜索来讲,搜索面临两个问题,一个是页面和关键字的匹配问题,一个匹配成功的页面之间的页面排名问题。比如说,你搜数学之美,搜索引擎会首先筛选出和这个问题相关的页面,然后在这些筛选出来的页面里给你提供最有可能让你满意的页面。能把搜索问题,提炼成上述的两个小问题,就是“术”的部分,和“技”无关。

如果你的任务,是设计一个页面排名的方案,你会怎么设计?真的推荐你想一想,看看你是用凑的方式,还是会从数学中找到灵感。如果是凑的话,你会怎么凑。在我读这本书之前,我只知道凑。我的思路可能是设计一个打分函数,对每个页面进行打分,分越高越好。其中打分的部分包扩,页面字数的多少,字数多的,讲的就更深;还有文章的作者,越出名的作者,写的文章质量越高。

百度的李彦宏,谷歌的拉里佩奇都思考过这个问题,并且还写了论文,开了公司。这本书里吴军老师讲了拉里佩奇的PageRank算法,里面用到了图论,线性代数,概率论,收敛的证明,分布式计算MapReduce。

搜索问题,只是其中的一个例子,如果你想知道语音识别是怎么设计的,信息论在其中扮演了什么角色,如何摆脱凑的局面,那么这本书会给你带来很多启发。

王辉 wechat
交流或订阅,请长按或扫描上方微信二维码