在中文搜索中,所谓的技术壁垒体现在5方面:首先是内容的丰富程度,互联网的信息不仅庞,且增长快,表现形式复杂,足够全收录网页,有很的技术难度;其次是响应速度,同使数千万、亿的网页,在同一间高速响应,从技术很难解决;三是相关,随便输一词就查很内容,但让户先哪,哪,面涉及的技术被引擎行业研究了近10年;四是更新频率,新的内容否被收录,旧的内容何死掉,新内容何被户检索是技术难题;五点跟中文有关系,一是切词,二是双字节。
除此外,搜索引擎涉及万项专利技术。每一项技术做是很难的,需优秀的技术团队长间的积累。
——2009年5月,接受《21世纪经济报》采访
背景分析
中英文搜索是完全不一的。英文搜索,遇的是一空格相隔的词,中文的词与词间是需进行“切词”的(即合理分隔一句子中的字词)。何让机械的搜索引擎准确按照中国人的思维习惯将词“切”,百度在方面已经捷足先登。
就是李彦宏所认的百度不被打败的原因。李彦宏是骄傲的:在中国,许领域的中国制造超越跨国公司……(内容加载失败!)
(ò﹏ò)
抱歉,章节内容不支持该浏览器显示~
【为了使用完整的阅读功能】
请考虑使用〔Chrome 谷歌浏览器〕、〔Safari 苹果浏览器〕或者〔Edge 微软浏览器〕等原生浏览器阅读!
谢谢!!!