天天视讯!谷歌推出大模型 AudioPaLM,可支持文本及语音
2023-06-26 18:27:06 ZAKER科技


(相关资料图)

近日,谷歌方面宣布推出能够处理和生成文本及语音的大型语言模型(LLMs)AudioPaLM。据了解,AudioPaLM 将两个现有的大模型、即文本大模型 PaLM-2 和语音大模型 AudioLM,融合到一个统一的多模态架构中,并利用该架构处理和生成文本和语音。

据谷歌方面透露,AudioPaLM" 继承 " 了 PaLM-2 模型的语言知识,以及 AudioLM 模型保留副语言信息(例如说话者身份和语调)的能力,从而能够更全面地理解和生成文本和音频,使得其能够适用于语音识别、语音翻译、语音转文字的多种应用场景。

据了解,AudioPaLM 使用了一个联合词汇表,可使用有限数量的离散标记表示语音和文本。并将这个联合词汇表与标记化的任务描述相结合,此外 AudioPaLM 还可以在各种声音和基于文本的任务上训练单个解码器模型,这也意味着传统需要单独模型来处理的语音识别、文本转语音合成和语音到语音翻译等任务,可统一到一个架构和训练过程中。

谷歌方面透露,经试验表明,AudioPaLM 在语音翻译方面的表现明显优于现有模型。同时 AudioPaLM 还展现了对语言组合执行零样本语音到文本翻译的能力,也就是说这款大模型可以准确地将陌生语言的语音翻译成文本。

此外,AudioPaLM 还可基于简短的口语提示在语言之间进行声音转换,并捕捉和重现不同语言中的独特声音,以实现语音转换和适应。

对此谷歌方面表示," 我们证明,用纯文本大语言模型的权重初始化 AudioPaLM 可改善语音处理,也成功地利用了预训练中使用的大量文本训练数据来帮助语音任务。所得模型在语音翻译任务方面明显优于现有系统,并且能够对训练中未发现输入 / 目标语言组合的许多语言,执行零样本语音到文本的翻译。AudioPaLM 还演示了音频语言模型的功能,例如基于简短的语音提示跨语言传输语音。"

【本文图片来自网络】

热门推荐

文章排行

  1. 2023-06-26天天视讯!谷歌推出大模型 AudioPaLM,可支持文本及语音
  2. 2023-06-26精彩看点:中国股市:全职炒股养家,还要跌,继续空仓(6.26日)
  3. 2023-06-26中电港:深圳中电投资有限公司与中电港不存在同业竞争
  4. 2023-06-26Win11卡到怀疑人生!原因找到了:微软认错
  5. 2023-06-26陕西省印台区发布雷雨大风黄色预警 每日观点
  6. 2023-06-26淘宝(客服) 环球微动态
  7. 2023-06-26东北2男子街头争执,不动手只互骂,嘴皮子像打快板口水互喷一脸-焦点简讯
  8. 2023-06-26中证500ETF(159922)成交额超7亿元 第一大重仓股昆仑万维跌超10%丨ETF观察
  9. 2023-06-26福能东方:正在与政府协商退回重庆机器人产业园项目用地 |天天速递
  10. 2023-06-262年被家暴16次疑当事女子发声:终于有人替我申冤|天天动态
  11. 2023-06-26“由着熟到懂劲”:让身体明白很重要 全球头条
  12. 2023-06-26合肥市六安路小学中铁校区:中期评估聚时效 提炼成果行致远_天天精选
  13. 2023-06-262023年6月26日甲基丙烯酸价格最新行情预测|当前快播
  14. 2023-06-26全球滚动:爱情眼力特别好的4个星座,总能遇到对的人
  15. 2023-06-25报道:青城山到成都怎么坐车
  16. 2023-06-25煮酒论英雄片段_煮酒论英雄_世界快播
  17. 2023-06-25瓣的部首怎么读_瓣的部首-环球热文
  18. 2023-06-25从“一粒种子”看黑土地稳产增产秘诀 快资讯
  19. 2023-06-25全球快看点丨在华清宫过端午节 感受传统文化魅力
  20. 2023-06-25广东高考生6月28日开始填报志愿!-天天资讯