音乐也逃不过AIGC：国风摇滚都来得_中国智能在线

“再多看一眼就会爆炸，再靠近点就快被融化”到底是个什么感觉？

（这是一句《只因你太美》中的歌词）

(资料图片)

下面的音乐或许能让你体会到这种“从来未有”的feel，坤坤听了都会直呼内行。

这段音乐来自Meta最新推出的文生音乐工具MusicGen。

只需要输入一段文字，点击生成按钮就能得到一段最长30秒的音乐，而且支持中文。

不懂乐理也没关系，MusicGen还可以上传已有的音乐作为参照。

比如上面这段音乐就是结合了原曲旋律重新生成的。

如果你实在不知道怎么prompt，也可以像这位网友一样问问ChatGPT：

无论是国风还是摇滚风都能轻松驾驭，甚至是两者结合。

哪怕国风伴奏也难不倒MusicGen。

测试结果显示，MusicGen的综合评分比谷歌的MusicLM高出了5.36%。

有网友给出了详细的测评体验：

这个模型似乎没有专门针对乐队名称进行训练，但用已有的风格生成音乐时表现非常好。
…… 尽管（项目）网站中的示例是（开发者）挑选过的，但这并不能否定它可以生成好的作品。

如何实现

音乐的合成涉及多段旋律以及多种音色（乐器）之间的协调。

而不同于语音合成，人类对音乐之中的不和谐因素更为敏感。

那么MusicGen是如何完成这一复杂任务的呢？

我们先来看看它的训练数据。

Meta团队一共使用了两万小时的音乐。

这之中包括一万条内部搜集的高质量音轨以及ShutterStock和Pond5素材库中的数据。

来自后两者的数据量分别为2.5万和36.5万。

这些音乐数据在32kHz下被重新采样，都配有流派、BPM等基本信息和复杂一些的文字说明。

除了上述训练数据，Meta团队还准备了评价数据集MusicCaps。

MusicCaps由5500条专业作曲家谱写的10秒长的音乐构成，其中包括一千条平衡各个音乐流派的子集。

说完训练数据，我们来具体看看MusicGen的工作流程。

第一步是将声音信息转化为token。

这一步使用的是Meta去年研发的卷积网络编码器EnCodec。

至于编码方式，Meta团队通过实验对四种不同的方式进行了测试。

最终，团队选择了延时模式（下图右下）并进行了精准建模。

最核心的Transformer部分，团队训练了300M、1.5B、3.3B三个不同参数量的自回归式Transformer。

在混合精度下，训练上述三个参数量的Transformer分别使用了32、64和96块GPU。

对于文字处理，在评估了多个前人成果后Meta团队最终选用了Google团队2020年提出的T5模型。

对于音乐旋律的调整，团队选用了无监督的方式进行，规避了监督数据不佳导致的过拟合问题。

最终，Transformer输出的数据被转换为对数形式，然后根据编码本生成最终的成品。

体验方式

目前，想要体验MusicGen，一共有三种方式。

第一种方式是直接用官方在Hugging Face发布的DEMO 。

（传送门见文末）

这种方法操作最为简单，点进链接就能用。

缺点是得排队，有时候还会赶上服务器被挤爆、重新building等情况。

第二种是通过谷歌Colab 搭建。

比第一种多了个一键部署的步骤，不过也比较简单，官方已经把部署要用的代码准备好了。

（传送门见文末）

进入之后，点击左上角的运行按钮即可完成一键部署，然后会得到一个专属链接，点进去就可以体验了。

不过这种操作方式需要谷歌账号才能用。

第三种方式则是自行部署。

你需要有足够性能的GPU，且已经安装了PyTorch2.0或以上版本。

使用下面的命令即可完成安装：

#Besttomakesureyouhavetorchinstalledfirst,inparticularbeforeinstallingxformers.

#Don"trunthisifyoualreadyhavePyTorchinstalled.pipinstall"torch>=2.0"#Thenproceedtooneofthefollowingpipinstall-Uaudiocraft#stablereleasepipinstall-Ugit+https://git@github.com/facebookresearch/audiocraft#egg=audiocraft#bleedingedgepipinstall-e.#orifyouclonedtherepolocally

安装好后，使用【python app.py】命令即可运行。

推荐内容

音乐也逃不过AIGC：国风摇滚都来得

2023-06-14
继续挑干的唠：百融云有没有AI大模型数据优势？观察

2023-06-14
苹果MR现世，VR回光返照？|今日热讯

2023-06-14
环球热推荐：我被骗了，到底哪个App干的？

2023-06-14
亚马逊旗下云服务AWS在周二遭遇了一次宕机

2023-06-14
一夜之间，TikTok电商变阵_天天热资讯

2023-06-14
快讯：AI早知道-20230614

2023-06-14
产业互联网的商业逻辑与创新精要

2023-06-14
大厂出品！这个AI网站太顶了，所有功能免费用世界热消息

2023-06-14
“偷拍”卷起巨大舆论漩涡，网络时代“肖像权”无处安放？当前焦点

2023-06-14
全球动态:AI凶猛，工业机器视觉狂奔|行业发现

2023-06-14
世界关注：权威发布！元年科技正式成为北京信创工委会副理事长单位

2023-06-14
马斯克评论苹果威胁下架Damus

2023-06-14
从T5到GPT-4！大语言模型全新综述来了当前报道

2023-06-14
多云时代来临，容器存储谁敢横刀立马？

2023-06-14
苹果正在为Vision Pro打造3D影视内容；JBD完成数亿元A3+及A4轮战略融资

2023-06-14
Transformer六周年：当年连NeurIPS Oral都没拿到，8位作者已创办数家AI独角兽|全球快报

2023-06-14
对话新势界CEO：混合现实技术点亮AR记忆生态_世界看热讯

2023-06-14
世界播报:闲鱼的两难：“小淘宝”还是大社区？

2023-06-14
微软：站上云巅

2023-06-14
当前要闻：73亿网龙创始股东郑辉去世，公司曾靠薅百度羊毛赚60亿

2023-06-14
生成式AI市场规模2032年有望增长至1.3万亿美元年复合增速达42%_天天报资讯

2023-06-14
“数字经济”43大细分方向-景气比较框架

2023-06-14
最新快讯!英伟达AI技术让2D视频快速转成3D模型

2023-06-14
环球通讯！苹果将开放Vision Pro开发者套件的申请；传Sony拒绝为Vision Pro扩产MicroOLED面板

2023-06-13
私域的痛，企业微信向用户收费开割_环球微速讯

2023-06-13
对话唱吧创始人陈华：要做3D互联网时代的短视频平台

2023-06-13
环球今日报丨3500万元！中国广电互联网及传统媒介投放项目招标

2023-06-13
环球热资讯！登上第一“宝座”，亚马逊云科技谱写数据库市场新格局

2023-06-13
5G低损耗材料暗藏玄机世界快资讯

2023-06-13
沈阳元宇科技公司Web3.0飞语生态东北运营中心成立-环球时快讯

2023-06-13
金融SCRM厂商「蘑菇」完成新一轮数千万元融资_今日视点

2023-06-13
箱箱共用完成2亿元D轮融资

2023-06-13
Mantle：以模块化设计实现以太坊Layer2可扩展性突破每日快报

2023-06-13
智联安CEO吕悦川：5G低功耗定位市场需求广阔，应提前布局

2023-06-13
TapTap创始人创业项目转型，游戏社区成了创业陷阱？

2023-06-13
办个手机套餐还办出套路！用户的知情权得靠什么去保障

2023-06-13
数据科学家张溪梦：数据是生成式AI的根基|全球实时

2023-06-13
ChatGPT概念飞起，并不适合于散户投资

2023-06-13
当科幻照进现实，数字人分身已悄然来到身边|环球信息

2023-06-13
私域动态：OpenAI回应没有上市计划;阿里增设人民币柜台;天涯团队回应筹款失败…

2023-06-13
蚂蚁科技、京东、腾讯等向开放原子基金会捐赠 20 个开源项目快看点

2023-06-13
今日快看!苹果Vision Pro的另一面：虚拟人3.0要爆发了

2023-06-13
世界聚焦：打工人不崩溃，要靠ChatGPT的情绪价值撑着

2023-06-13
扎克伯格称苹果头显没突破性；上海发出全国首批无驾驶人路测牌照 | 图灵周报全球快报

2023-06-12
PaaS的诅咒_天天消息

2023-06-12
统一形象！中国广电发布工作服装统一设计方案

2023-06-12
【重磅】首个分支机构注册成立！中国广电网络股份有限公司山东分公司注册成立

2023-06-12
天天热讯:ChatGPT做 “ 小红书 ” 自媒体，百万博主的爆款制造机，根本停不下来

2023-06-12
让软件研发可视化可量化，华为云CodeArts持续加速企业研发转型

2023-06-12

音乐也逃不过AIGC：国风摇滚都来得

2023-06-14
中钢国际：接受天风证券等机构调研

2023-06-14
痘印怎么消除不用护肤品不花钱_痘印怎么消除|全球今日报

2023-06-14
继续挑干的唠：百融云有没有AI大模型数据优势？观察

2023-06-14
中国人寿个人养老年金保险是什么？如何购买？最新消息

2023-06-14
中国常驻联合国副代表：未来峰会应有助于推动落实2030年可持续发展议程全球热讯

2023-06-14
微软推出LLaVA-Med模型可根据CT、X光图片等推测患者病理状况-天天亮点

2023-06-14
新世界与Visa组战略合作|焦点报道

2023-06-14
朗生医药(00503)6月14日回购10万股世界实时

2023-06-14
每日快讯!中国本土便利店崛起，全靠外卖？

2023-06-14
告别野蛮生长后，直播带货该怎么玩？

2023-06-14
王慧文卸任水滴筹旗下公司职务

2023-06-14
摇曳露营手游下载地址在哪摇曳露营手游官网介绍世界报资讯

2023-06-14
苹果MR现世，VR回光返照？|今日热讯

2023-06-14
环球速看：排查小钢瓶保障大平安新乡市凤泉区城管局开展专项整治执法行动

2023-06-14
甘肃张掖：“乐游甘州·水上嘉年华”观光娱乐项目正式启航|前沿热点

2023-06-14
每日热议!“蚕宝宝”为广西荔浦乡村振兴加油助力

2023-06-14
C视频丨宜宾：金沙江上五桥同框 “立体”夜景更迷人

2023-06-14
环球今日讯！嘉定发布雷电黄色预警、大风蓝色预警！

2023-06-14
热点！酷狗子公司诉特斯拉侵权案明日再开庭

2023-06-14
内江市东兴区通报城管与摊贩冲突事件：6名机动巡查人员停职

2023-06-14
成都膨胀中环球快播报

2023-06-14
腾讯RoboticsX用预训练模型和强化学习提升机器狗控制世界快播

2023-06-14
环球热推荐：我被骗了，到底哪个App干的？

2023-06-14
环球观天下！简述行政执行的重要性_理解行政执行的含义应该把握哪些要点

2023-06-14
亚马逊旗下云服务AWS在周二遭遇了一次宕机

2023-06-14
祝福语汇总全球观速讯

2023-06-14
勐腊县与中老磨憨－磨丁经济合作区签订跨界河湖合作协议

2023-06-14
【世界速看料】勒普森定制（勒普累F.）

2023-06-14
南京：没有公交站台可以用手机呼叫“响应式公交” 每日消息

2023-06-14
韩国厂商拿着最大的IP，却做不出高流水游戏？每日信息

2023-06-14
北向资金净卖出超20亿元

2023-06-14
车圈撕起来，饭圈都得靠边站

2023-06-14
环球滚动:英伟达、甲骨文联手投资的 AI 独角兽，如何抢跑 OpenAI？

2023-06-14
美国版贴吧Reddit被用户“爆吧”，全世界社区都没法活了？

2023-06-14
体验就是意义，500场演唱会盯着年轻人钱包

2023-06-14
【快播报】今年前5个月上海市进出口总值1.74万亿元，创历史同期新高

2023-06-14
一夜之间，TikTok电商变阵_天天热资讯

2023-06-14
快讯：AI早知道-20230614

2023-06-14
海关总署推出16条优化营商环境新举措-新要闻

2023-06-14
广发证券：AI算力板块下半年还存在超预期可能，目前这轮行情远未结束

2023-06-14
蚂蚁区块链等75家单位加入中国电子信息行业联合会

2023-06-14
环球消息！耐克休闲鞋_耐克鞋

2023-06-14
中科智驰完成数千万元A轮融资-快资讯

2023-06-14
Counterpoint：中国千元左右入门级手机市场Q1增长22%，但整体下滑5%-世界报道

2023-06-14
全球看热讯：保时捷投资电享科技

2023-06-14
观速讯丨重大突破中科院宣布！比英伟达快1.5到10倍，AI芯片要变天？

2023-06-14
全国会计资格考试官网登录全国会计资格考试官网入口2021

2023-06-14
产业互联网的商业逻辑与创新精要

2023-06-14
华电新能：募资额将超过工业富联，报告期内每12天受到一次行政处罚｜IPO观察

2023-06-14
城发环境：截至目前，公司在运垃圾发电项目31个

2023-06-14
借据未写利息能否起诉索要全球热议

2023-06-14
“偷拍”卷起巨大舆论漩涡，网络时代“肖像权”无处安放？当前焦点

2023-06-14
全球动态:AI凶猛，工业机器视觉狂奔|行业发现

2023-06-14
全国农业气象情报

2023-06-14
大厂出品！这个AI网站太顶了，所有功能免费用世界热消息

2023-06-14
device error code : 0x0406（device error code 0x0406）|每日关注

2023-06-14
每日短讯：2023年管桩行业概况及现状：国内混凝土管桩市场规模超过296.5亿元

2023-06-14
自然资源部：2022年我国锂矿储量同比上涨57% 锂电新能源产业兴起带动锂矿需求上涨

2023-06-14
3dmax渲染蓝屏怎么回事

2023-06-14
一个元气森林的东北小城下沉失败样本

2023-06-14
运力饱和背后，滴滴们跑不进下沉市场？

2023-06-14
【环球新视野】五菱扛住了比亚迪的炮火

2023-06-14
没钱才是死穴！大连人支持谢晖但绝非无限容忍梭鱼湾战海牛或定生死天天信息

2023-06-14
热点评！苹果MR现世，VR回光返照？

2023-06-14
世界关注：权威发布！元年科技正式成为北京信创工委会副理事长单位

2023-06-14
从T5到GPT-4！大语言模型全新综述来了当前报道

2023-06-14
思想克隆！前OpenAI研究员让AI模仿人类思维，现实版「机械姬」降临

2023-06-14
（成都大运纪事）海外华媒看大运走进成都简阳见证赛事与城市的“双向奔赴”

2023-06-14
多云时代来临，容器存储谁敢横刀立马？

2023-06-14
马斯克评论苹果威胁下架Damus

2023-06-14
成都天气预报成都2023年05月09日天气全球新要闻

2023-06-14
【天天播资讯】文献剧《费孝通的魁阁时代》在昆上演

2023-06-14
环球时讯：天猫好房上线大理站

2023-06-14
“万米文化”获千万级天使轮融资最新快讯

2023-06-14
死螃蟹能吃吗有没有毒_死螃蟹能吃吗

2023-06-14
当前观点：AMD公布新款MI300X AI芯片

2023-06-14
全球速讯：“安托”获通用资本领投数千万元融资

2023-06-14
48亿元人民币被没收？小米回应|世界观察

2023-06-14
一袋猪饲料多少钱 (一包猪饲料)-当前快讯

2023-06-14
6月14日 10:22分中关村（000931）股价快速拉升|全球快看点

2023-06-14
全球视讯！“锐泰微电子”完成近亿元A轮融资，云岫资本担任独家财务顾问

2023-06-14
世界播报:闲鱼的两难：“小淘宝”还是大社区？

2023-06-14
孪井滩生态移民示范区：园区建起工作站政务服务“零距离”

2023-06-14
苹果正在为Vision Pro打造3D影视内容；JBD完成数亿元A3+及A4轮战略融资

2023-06-14
Transformer六周年：当年连NeurIPS Oral都没拿到，8位作者已创办数家AI独角兽|全球快报

2023-06-14
微软：站上云巅

2023-06-14
小白龟的猫异瞳（小白龟的猫）

2023-06-14
对话新势界CEO：混合现实技术点亮AR记忆生态_世界看热讯

2023-06-14
世界微动态丨果园里桃李飘香笑声阵阵

2023-06-14
不同人群如何参加医保？这份指南请收好_当前要闻

2023-06-14
8月1日起，赤峰电动车将迎来“8+2”新规，涉及车辆上牌和上路-热头条

2023-06-14
奇信退6月14日加速下跌|环球观天下

2023-06-14
【独家焦点】厄尔尼诺警报！全球将迎高温“烤”验

2023-06-14
5月全球新增独角兽7家，中国新增3家；36家中国企业完成IPO丨睿兽分析投融资月报

2023-06-14
生成式AI市场规模2032年有望增长至1.3万亿美元年复合增速达42%_天天报资讯

2023-06-14
“数字经济”43大细分方向-景气比较框架

2023-06-14
新股日历：今天新股上市一览（6月14日）|天天讯息

2023-06-14
最新快讯!英伟达AI技术让2D视频快速转成3D模型

2023-06-14
当前要闻：73亿网龙创始股东郑辉去世，公司曾靠薅百度羊毛赚60亿

2023-06-14