HuggingFace_借助ai实现图片转文字以及音乐，还有更牛的文字生成音乐功能-回家啦我的学习小站

HuggingFace_借助ai实现图片转文字以及音乐，还有更牛的文字生成音乐功能

之前小啦分享过不少AI类工具，像AI绘画、AI语音、AI图片修复等都是非常好用的工具，不过呢这些工具普遍也存在一个问题：功能过于单一，要么只能处理图片，要么只能处理语音

如果能有一个AI工具将图片与声音或将文字与声音结合，也许就会有趣不少。

你还别说，小啦还真找到了这么一个牛掰的工具，只需上传一张图片或一些文字，就能生成一首30秒的音乐！

这是国外的一个开源项目源项目，拥有文字生成音乐、图片生成音乐、图片生成文字等功能。

上传对应的内容，稍等一会，他就会根据算法来生成一段30秒长的音乐

它最基础也是最牛的功能：文字转音乐。

只需在Prompt中输入文本内容，并以逗号分隔即可。输入完毕后点击Submit，它就会根据文本内容自动生成音乐

注意：由于是国外的网站，关键词需要用英文。

比如，这里以女孩（girl）、风（wind）作为关键词生成一段音乐。把这两个关键词结合在一起，你会想到什么？让小啦来说的话，就是活泼的女孩，宁静的风

听听生成的效果，一整段活泼轻快的音乐，是不是特别符合活泼的女孩在风中徜徉的那种气氛

再以山、水作为关键词生成一首音乐，这个效果我直接卧槽了！颇有种高山流水、仙音悦耳的感觉，大写的牛！

之前给大家安利的AI绘画工具都是把文字描述的内容转换为图片，今天，咱们直接来一波反向操作，直接把图片转换成文字。

‍

上传一张，点击下Submit，稍等一会儿，就能获取机器对文字的描述了。

来一张街道的漫画图，看下效果。

都是英文，看起来有点麻烦，翻译中文：

一幅有高楼的城市街道的绘画，詹姆斯·吉列德，CG Society，美国场景绘画，（紫色），进入蜘蛛世界，宽屏拍摄，纽约，加密的虚拟世界，风格绘画，来自复仇者联盟（2012），卡通着色器，cp2077

描述还是挺准确的

如果换成小姐姐会发生啥呢？不废话，直接来个试试。

一个穿着连衣裙的女人坐在椅子上，灵感来自张舒淇，黑色的短卷发微笑，撩人的身体与性感的腹部，macross边疆，流动的姜黄色头发，老写真书，美丽的窗帘，风移动她的衬衫，华丽的斯特拉梅芙魔术师，照片，年轻，裸露。

关键词基本都出来的，唯一比较难受的是描述有点机械和呆板

图片转音乐，也就是大家在开头见到的那个效果，上传一张图片，点击Generate Music from Image，稍等片刻，一首图片的专属音乐就轻松诞生了！

老规矩，还是先来张小姐姐的照片，看看效果。

喝奶茶的时尚小姐姐，生成一段赛博朋克风的BUG没毛病吧？大家听听这欢快又不失科技感的节奏，和图片还是相当搭的。

这一段我承认，确实差点意思但也还能接受，现阶段AI能达到这种程度已经相当了不起，咱也不能要求所有情景都能100%到位

当然，除了上面给大家展示的内容外，如果选择合适的图片或文字，甚至还会产生一些奇奇怪怪的声音，但为了防止有人社死，小啦就不放出来了，如果想要体验，可以直接将梵高的《星月夜》转换为音乐

HuggingFace_借助ai实现图片转文字以及音乐，还有更牛的文字生成音乐功能