我们常常能看到某某公司开源了一款AI大模型的新闻。
这些模型都有着超强的能力,从天生大段的笔墨、逼真的图像,到理解和翻译不同措辞,再到创造出令人叹为不雅观止的音乐和艺术作品。

对付我们普通人来说,这些高科技听起来不仅遥不可及,而且彷佛与我们的日常生活无关,他们像是只有那些天才和大神们才能操作和利用的。

但是这些强大的AI模型,并不止是大神们才能打仗和利用,实际上,这些模型的利用门槛实在不高。
任何对AI感兴趣的人都可以轻松获取和利用这些模型,就像搭乐高积木一样,将它们组合起来,创造出你心目中的运用。

这统统既不须要深厚的技能背景,也不须要繁芜的编程技能。
只要你有想法和一丢丢的学习,这些强大的模型就能成为你随意操作的「乐高」,搭建出你设想的样子。

AI入门第一课把模型跑起来

下面我们一起来看下,如何把模型跑起来~

第一步:找到一个模型

首先,第一步我们得知道去哪里找到这些模型,很大略,有一个神奇的网站叫:Hugging Face(https://huggingface.co/),这个网站实质便是一个大模型的托管网站,目前这个网站托管的AI模型超过57万。
一些热门的模型,比如meta的Llama系列模型,google的Gemini等都托管在这个网站上,任何人都可以访问并利用它们。

假设,我们现在要找一个模型,可以实现读图的功能,便是给它一张图片,它可以见告我这个图片里的紧张内容是什么。
这个模型的逻辑如下图,非常大略,输入一张图片,输出一段图片的文本描述。

这个模型实质上便是一个图片到文本的模型,我们在Hugging Face里选择Image-to-Text的分类,然后从得到的结果里看排名第一个的模型,便是下图红框圈选的:Salesforce/blip-image-captioning-large,这个便是模型的名字。

点击模型进行模型的详情页,这里有模型的详细事理先容,以及在线试用的功能,可以在这里直接体验模型的效果。

找到了模型之后,我们接下来第二步,如何支配和利用模型。

第二步:模型的支配和利用

模型的利用涉及到模型的加载、预处理、模型推理和后处理步骤等,听起来彷佛很繁芜,但是不用担心,Hugging Face还给我们供应了一套利用的工具,那便是Transformers库中的pipeline方法,pipeline 将前面提到的模型利用所有步骤封装成一个大略的函数调用。
我们只须要利用这个函数方法,指定须要完成的任务类型,当然我们也可以指定特定的模型和配置来定制利用。
Transformers库是由Hugging Face公司开拓的一个开源Python库,里面除了pipeline外,还有很多其它的方法和工具,这里就不细说了。

详细的利用实在便是几行Python代码就可以搞定,非常大略。
这里额外说下,我们常常在利用写python的时候,须要安装编译器和配置环境,每每这些环境配置就已经花费了我们的所有激情了。
这里,感谢google大大供应的一个在线编程工具colab,直接办理所有安装和环境问题。

Colaboratory界面如下,便是一个可以在线写python代码的「条记本」。

我们新建一个文件,然后输入第一行代码:

pip install transformers

就这样一行代码,Transformers库就安装好了。
后面详细的操作,点击上传图片。

随后编写的代码和解释如下,懂一点点python和编程的人,该当就能写出来。
写完后点击代码侧边的运行按钮即可。

输出的文案是:arafed woman sitting on the ground with a camera and a tripod. (一位戴着头巾的女性坐在地上,阁下放着相机和三脚架。
)基本识别出来图片中的紧张内容。

到此,我们的第一个模型的选择和利用的demo就完成了。

这段代码的地址如下:

https://colab.research.google.com/drive/1NWTircHzljiU2MNCKjA9PpyGJCMcpqmc?usp=sharing

三、末了

如果我们有更繁芜的想法,比如我们可以用得到的图片描述,再用LLM模型,帮助编写一个故事脚本,再通过一个文生视频模型,变成图片或者视频,详细的流程如下图所示。

这些都是可以用一个一个模型拼接出来的。
至于如何拼接,后续的文章中会连续先容。

因此,在AI时期来临之际,如果你是一个有想法的产品,那么可以自己通过这些多种多样的模型实现自己的想法。
分享一个我看到的故意思的模型实践,利用codeformer模型,去除图片的马赛克,大家可以去huggingface上体验下,https://huggingface.co/spaces/sczhou/CodeFormer

溘然觉得这个运用可能蛮有前景!
你以为呢?哈哈哈。
我也是AI入门学习者,对付模型的利用还有很多其它的平台和方法,我也在摸索中,欢迎大家互换谈论~

专栏作家

南村落小付,微信"大众年夜众号:南村落小付,大家都是产品经理专栏作家。
快手高等产品经理,曾任职阿里,欢聚时期,7年互联网产品设计运营履历。

本文原创发布于大家都是产品经理,未经容许,禁止转载

题图来自Unsplash,基于CC0协议

该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。