全球首个!英伟达发布了一把用于“声音的瑞士军刀”
11月26日讯,全球英伟达近日展示了其最新研发的首个声音士军人工智能模型——Fugatto。
Fugatto是英伟用于一款基于生成式Transformer架构的人工智能模型,其完整版配备了25亿个参数,达发的瑞刀并在由32个NVIDIA H100 Tensor Core GPU组成的布把NVIDIA DGX系统上进行了训练。
这款模型的全球主要功能在于能够修改和生成声音效果,专为音乐、首个声音士军电影和视频游戏制作人设计,英伟用于英伟达将其形象地称为“声音的达发的瑞刀瑞士军刀”。
据NVIDIA应用音频研究经理Rafael Valle透露,布把Fugatto的全球研发初衷是创建一个能够像人类一样理解和生成声音的模型。
它支持多种音频生成和转换任务,首个声音士军是英伟用于首个展示紧急属性的基础生成式AI模型,这得益于其各种训练能力的达发的瑞刀交互以及组合自由格式指令的能力。
Fugatto的布把功能十分强大,能够根据文本描述生成音效和音乐,例如将钢琴演奏转换成人声歌唱,或改变录音的口音和情绪。
对于音乐制作人而言,Fugatto可以帮助他们快速制作原型或编辑歌曲创意,尝试不同的风格、声音和乐器,同时添加效果并提高现有轨道的整体音频质量。
广告代理商则可以利用Fugatto快速定位多个地区或情况的现有广告活动,将不同的口音和情感应用于画外音。
视频游戏开发人员则可以使用该模型修改游戏中预先录制的素材,或根据文本说明和可选的音频输入动态创建新素材。
另外,Fugatto 的新颖性主要体现在以下方面:
首先,在推理过程中,该模型采用了称为ComposableART的技术,能够组合在训练期间只能单独看到的指令。
例如,通过组合提示,可以要求模型以法国口音说出带有悲伤情绪的文本。
此外,该模型在指令之间进行插值的能力使用户能够对文本指令进行精细控制,如重音的沉重程度或悲伤的程度。
其次,Fugatto还能够生成随时间变化的声音,NVIDIA将这一功能称为时间插值。
例如,它可以模拟暴雨穿过区域的声音,雷声逐渐增强,然后慢慢消失在远处。这一功能使用户能够精细地控制音景的演变方式。
最后,与大多数只能重现所接触的训练数据的模型不同,Fugatto允许用户创建以前从未见过的音景。
例如,它可以模拟雷雨随着鸟儿的歌声缓和为黎明的场景。
总而言之,Fugatto凭借其功能多样性和创新性,在音频领域具有广阔的发展空间。
- ·英伟达不再是“AI独宠”吗 苹果为亚马逊背书:考虑用其芯片来训练模型
- ·欧冠前5轮进球排名:巴萨18球居首,多特16球次席&曼城13球
- ·曾加:莫塔说尤文踢得比那不勒斯更好,我无法理解他为何这么说
- ·男子采挖3株野生红豆杉被判刑:获刑1年 罚款过万
- ·吉利星愿大卖爆单 4S店交不出车被车主集体投诉
- ·[流言板]给机会不中用!马丁二罚故意不中结果未沾框,黄蜂憾负热火
- ·埃梅里:绝杀被吹在英格兰80%不是犯规,但在欧战也许不是这样
- ·德转晒罗马新帅候选场均积分:曼奇尼1.89分,阿莱格里1.85分
- ·伤病管理!本西今天将出战国王 明天缺席客战勇士的背靠背
- ·回忆杀! 6种曾让人眼前一亮的手机设计 如今已成历史
- ·太阳报:阿莫林将让芒特成为新战术的关键部分
- ·1件顶7件:唐狮集团DESSO男女户外三合一冲锋外套85元新低
- ·记者:伊万明显甩锅队员,换成吴金贵、李霄鹏不至于输这么惨
- ·空调洗衣机过去十几年完全固化 卢伟冰:小米创新了从来没有的产品
- ·💸法鹰免签马尔穆什16场14球引豪门关注,去年卖穆阿尼赚9500万
- ·2024游戏十强年度榜提名:《黑神话:悟空》连刷7个榜单
- ·房产税收新政实施5日,36.4万户家庭累计减免契税84亿元
- ·[流言板]顺风顺水!迪林厄姆突破抛投打进,森林狼反超火箭3分
- ·辛巴又摊上事儿了!被实名举报涉嫌虚假宣传 官方已立案
- ·辛巴又摊上事儿了!被实名举报涉嫌虚假宣传 官方已立案
- ·[流言板]真中锋!哈特本赛季出战21场,其中18场命中率高于50%
- ·失望至极!姆巴佩社媒被刷屏:你对皇马毫无用处,滚回巴黎吧!
- ·于帕:外界对姆巴佩缺乏肯定,球员也是人,也有精神层面的需求
- ·NBA常规赛:湖人大胜马刺终结三连败 浓眉19+14+7詹姆斯三双
- ·对标RTX 4060!Intel锐炫B580限量版显卡图赏
- ·[流言板]美记:迪温琴佐被视为联盟中几支争冠球队的潜在交易目标