首页  /  电商资讯
亚马逊开发出有史以来最大的文本转语音模型
2024-02-18 20:12:37
4957浏览
近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。

2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。

近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

推荐阅读:

京东荣获2024年度Gartner供应链技术创新奖 

深圳跨境电商规模再创新高 

1.4亿人领到淘宝春节红包 

图文阅读
美国总统特朗普签署行政命令,将从2025年5月2日美国东部时间上午12:01开始,取消对来自中国大陆和中国香港的小额进口商品的免税待遇。
2025-04-03 13:50:51
TikTok Shop将于3月31日正式在法国、德国和意大利上线,进一步扩大其在欧洲的业务版图。
2025-04-01 11:27:33
闲鱼宣布调整手机品类的软件服务费规则。
2025-04-01 11:27:32
淘宝买菜业务调整:逐步退出基于本地供应链发货的次日自提社区团购业务,转做基于产地发货的快递电商业务。
2025-03-28 11:54:11
近日,拼多多甩出“王炸”举措,拼尽全力扶持商家发展。
2025-03-27 11:19:41
随着“中式梦核风”的走红,老旧电子产品迎来“第二春”。
2025-03-27 11:08:08
Shopee将在印度尼西亚停止使用极兔速递的标准和经济配送服务,此调整将于4月正式生效。
2025-03-27 11:01:45
TEMU近日宣布与跨境支付平台dLocal达成战略合作,通过提供本地化支付解决方案,共同开拓墨西哥、哥伦比亚、乌拉圭等14个新兴市场,为当地消费者提供无缝购物体验。
2025-03-26 11:18:10
快手电商牵手海尔热水器、海尔空调、海信电视、容声冰箱、海信空调等品牌展出新品。
2025-03-24 11:32:32
最新文章
美国5月2日起取消中国小额包裹免税政策
2025-04-03 13:50:51
TikTok Shop将于3月31日在法国、德国和意大利上线
2025-04-01 11:27:33
闲鱼抽佣越来越狠!
2025-04-01 11:27:32
亚马逊西班牙新物流站点DQA3投入运营
2025-03-28 14:46:45
淘宝买菜退出社区团购业务
2025-03-28 11:54:11
拼多多要拿出1000亿扶持商家
2025-03-27 11:19:41
闲鱼:近三月“中式梦核”单品销量环比上涨70%
2025-03-27 11:08:08
Shopee将在印尼停用极兔速递标准和经济配送服务
2025-03-27 11:01:45
精选专题
热门阅读
大家都在搜