找回密码
 成为会员

新浪微博登陆

只需一步, 快速开始

搜索
0赞
赞赏
手机版
扫码打开手机版
把文字装进口袋

Google工程师将语言翻译变成向量空间数学问题

冰客 2013-10-1 13:06:52
solidot

现有的基于统计翻译的在线工具如巴比鱼和Google翻译,翻译的结果勉强可用,但离完美还相去甚远。现在,Google工程师在预印本网站上发表论文,介绍了一种不依赖于统计翻译的新技术。他们的方法是将语言翻译变成向量空间数学问题,利用数据挖掘技术建模一种语言的结构,然后与另一种语言的结构进行对比。




01073415_IIr7.png




新 的方法是基于一个概念,即每一种语言都有一套相似的理念,因而使用单词的方式也存在相似性。例如,大多数语言中都有描述相同动物的单词,如狗、猫和牛,这 些单词很可能以相同的方式在句子中使用,如“猫是一种比狗小的动物”。语言中单词之间的关系集合被称为“语言空间”,可类比为一个点到另一个点的向量集 合,能以数学的方式进行处理,例如王减去男性加上女性等于女王(‘king’–‘man’+‘woman’=‘queen’)。在向量空间中,许多语言都 有共通之处,可以利用向量空间线性变换将一种语言翻译成另一种语言。Google工程师表示,新的方法非常有效。



该贴已经同步到 冰客的微博
您需要登录后才可以回帖 立即登录 新浪微博登陆
小帖士
如果你不是特别对他的每一句话感兴趣,不要随意用"关注"人的功能,因为关注以后,他的所有发帖回帖都会以通知的方式提醒你的!
统计信息
  • 会员数: 4661 个
  • 话题数: 8709 篇
  • 巅峰数: 8 人
返回顶部