第三章 Web 3.0 谷歌式科学

一巨的PB级计数的信息数据库曙光般的现,足改变我习的方式。科研工的传统方式需构造一符合已有数据的假说,或者依靠假说寻找新数据。现在数据库有量观测数据,了让我够展阶段的观测,什理论充分解释它呢?

被证实的是,数量惊人的数据足跳理论部分进行预测观察。谷歌是首先注意一现象的。谷歌的拼写检查例,你谷歌搜索的程中现拼写错误,它给拼写正确的搜索建议。谷歌是何知你写什词并预测其正确拼写方式的呢?并不是因它有正确拼写的理论或掌握了拼写规则,实,谷歌拼写规则一无所知。

相反,谷歌运行的是一非常庞的数据库,该数据库显示的是任何单词的给定拼写观测数据,些数据记载了诸少人在说“yes”的候意图拼写字母“y”类的数据。谷歌的拼写引擎完全由些数据点非英文的正确拼写概念构,是同一系统纠正任何语拼写错误的原因。

实,通研究海量数据的理念被谷歌运在了其翻译项目中。通匹配量人工翻译材料,谷歌翻译进行英译法、德译汉。例,在训练其法英翻译引擎,谷歌录……(内容加载失败!)

(ò﹏ò)

抱歉,章节内容不支持该浏览器显示~

【为了使用完整的阅读功能】

请考虑使用〔Chrome 谷歌浏览器〕、〔Safari 苹果浏览器〕或者〔Edge 微软浏览器〕等原生浏览器阅读!

谢谢!!!

拜托,搜索中立不可能目录+书签上行创造