广告

失传语言也能破解?麻省理工创建机器学习系统

2020-10-22 01:30:41 阅读:
麻省理工学院计算机科学与人工智能实验室最近在破译失传语言方面取得了突破性进展。麻省理工学院的研究人员创建了一个新系统,利用机器学习来帮助语言学家破译那些已经消失在时间中的语言。
广告

语言学家面临的挑战是很多的,这些失传的语言中,很多都没有一个经过充分研究的相对语言可以与之相比。有些还缺乏空白和标点符号等分隔符。麻省理工学院计算机科学与人工智能实验室最近在破译失传语言方面取得了突破性进展。

麻省理工学院的研究人员创建了一个新系统,利用机器学习来帮助语言学家破译那些已经消失在时间中的语言。

研究表明,大多数曾经存在过的语言都不再被使用,有几十种死亡的语言被认为是未被破译的。语言学家对语法、词汇和句法的了解不够,无法理解这些失传语言留下的文本。

研究人员创建了一个新的系统,已经能够自动破译一种失传的语言,而不需要它与其他语言关系的高级知识。该系统可以确定语言之间的关系,最近,该系统显示伊比利亚语与巴斯克语没有关系,一些语言学家认为。该项目的科学家们有一个最终目标,就是能够用仅有的几千个词来破译那些让语言学家们感到困惑的语言。

dead-languages-1280x720.jpg

项目负责人Regina Barzilay表示,该系统依靠的是基于历史语言学见解的七项原则。这些原则认为,语言一般只以可预测的方式进化。语言很少增加或删除整个音,而且很可能出现音的替换。例如,一个在母语中带有 "P "的单词在后裔语言中可能会变成 "B",但由于发音的差距,它不太可能变成 "K"。

利用这些语言限制,麻省理工学院的研究人员开发了一种解读算法,能够处理庞大的可能变换空间。该算法可以学习将语言声音嵌入到一个多维空间中,其中发音差异体现在相应向量之间的距离上。该模型旨在分割古代语言中的单词,并将其映射到相关语言中的对应物当中。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • Omdia :2024年生成式AI软件市场将增长124% 许多拥有大型语言模型(LLM)的供应商的收入运行率表明,2024 年的收入增长将达到三位数……
  • IDC首测8款最热门移动端大模型,3款获好评 本次报告的测评涵盖了市面上最热门的八个Chatbot App:kimi智能助手、豆包、海螺AI、天工、通义、文心一言、讯飞星火以及智谱清言(按照公司拼音首字母顺序排列)。
  • Imagination GPU为边缘智能提供高效率的加速 在“2024奕斯伟计算开发者伙伴大会”上,来自Imagination英国总部的专家发表了主题为《用RISC-V CPU + PowerVR GPU迎接边缘生成式AI的到来》的演讲。
  • 面向AI的下一代以太网技术 随着AI应用的广泛普及和数据流量的迅猛增长,传统以太网技术在延迟、带宽、拥塞控制和高性能可扩展方面天然局限,导致其难以应对AI网络的复杂需求。
  • 智能手机疲软,但超薄柔性玻璃出货量势头正猛 可折叠盖板玻璃必须符合以下所有标准:透明、可折叠、坚固、平整和轻薄,这些基本要素缺一不可。
  • 全球折叠屏手机快速增长,中国品牌压制三星 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进封装技术 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 智能手表OLED面板超 60%中国制造 智能手表在新冠肺炎疫情后获得了越发广泛的关注,其功能包括语音、健康检查、运动和活动追踪、GPS、通信和个人数据监控。全球智能手表显示面板的出货量已从2022年的2.59亿片增长到2023年的3.51亿片。到 2024年,Omdia预测智能手表显示面板的出货量将达到3.59亿片,其中TFT LCD占63%,OLED占37%。
  • 无处不在的Arm软硬件生态赋能开发者AI创新 随着计算变得愈发复杂,计算效率的重要性更胜以往。
  • 荣耀拿下欧洲横折手机榜第一 既然可以保留几乎相同的旧款手机,或者以更低的价格购买旧款手机,为什么要购买最新款的智能手机呢?但变化已经到来,智能手机品牌厂商正带着其最前沿的创新技术重返欧洲市场……
广告
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了