之前小啦分享过不少AI类工具,像AI绘画、AI语音、AI图片修复等都是非常好用的工具,不过呢这些工具普遍也存在一个问题:功能过于单一,要么只能处理图片,要么只能处理语音
如果能有一个AI工具将图片与声音或将文字与声音结合,也许就会有趣不少。
你还别说,小啦还真找到了这么一个牛掰的工具,只需上传一张图片或一些文字,就能生成一首30秒的音乐!
1、Hugging Face(网站)
这是国外的一个开源项目源项目,拥有文字生成音乐、图片生成音乐、图片生成文字等功能。
上传对应的内容,稍等一会,他就会根据算法来生成一段30秒长的音乐
- 文字转音乐
它最基础也是最牛的功能:文字转音乐。
只需在Prompt中输入文本内容,并以逗号分隔即可。输入完毕后点击Submit,它就会根据文本内容自动生成音乐
注意:由于是国外的网站,关键词需要用英文。
比如,这里以女孩(girl)、风(wind)作为关键词生成一段音乐。把这两个关键词结合在一起,你会想到什么?让小啦来说的话,就是活泼的女孩,宁静的风
听听生成的效果,一整段活泼轻快的音乐,是不是特别符合活泼的女孩在风中徜徉的那种气氛
再以山、水作为关键词生成一首音乐,这个效果我直接卧槽了!颇有种高山流水、仙音悦耳的感觉,大写的牛!
- 图片转文字
之前给大家安利的AI绘画工具都是把文字描述的内容转换为图片,今天,咱们直接来一波反向操作,直接把图片转换成文字。
上传一张,点击下Submit,稍等一会儿,就能获取机器对文字的描述了。
来一张街道的漫画图,看下效果。
都是英文,看起来有点麻烦,翻译中文:
一幅有高楼的城市街道的绘画,詹姆斯·吉列德,CG Society,美国场景绘画,(紫色),进入蜘蛛世界,宽屏拍摄,纽约,加密的虚拟世界,风格绘画,来自复仇者联盟(2012),卡通着色器,cp2077
描述还是挺准确的
如果换成小姐姐会发生啥呢?不废话,直接来个试试。
一个穿着连衣裙的女人坐在椅子上,灵感来自张舒淇,黑色的短卷发微笑,撩人的身体与性感的腹部,macross边疆,流动的姜黄色头发,老写真书,美丽的窗帘,风移动她的衬衫,华丽的斯特拉梅芙魔术师,照片,年轻,裸露。
关键词基本都出来的,唯一比较难受的是描述有点机械和呆板
- 图片转音乐
图片转音乐,也就是大家在开头见到的那个效果,上传一张图片,点击Generate Music from Image,稍等片刻,一首图片的专属音乐就轻松诞生了!
老规矩,还是先来张小姐姐的照片,看看效果。
喝奶茶的时尚小姐姐,生成一段赛博朋克风的BUG没毛病吧?大家听听这欢快又不失科技感的节奏,和图片还是相当搭的。
这一段我承认,确实差点意思但也还能接受,现阶段AI能达到这种程度已经相当了不起,咱也不能要求所有情景都能100%到位
当然,除了上面给大家展示的内容外,如果选择合适的图片或文字,甚至还会产生一些奇奇怪怪的声音,但为了防止有人社死,小啦就不放出来了,如果想要体验,可以直接将梵高的《星月夜》转换为音乐
2、Hugging Face(地址)
https://ml.huijiala.com/url-4080.htm(文字转音乐)
https://ml.huijiala.com/url-4081.htm(图片转文字)
https://ml.huijiala.com/url-4082.htm(图片转音乐)