腾众软件科技有限公司腾众软件科技有限公司

两斤大概有多重参照物,2斤有多重?

两斤大概有多重参照物,2斤有多重? ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软公司创始人比尔(ěr)·盖茨已多次公开(kāi)谈(tán)论人工智能话题。在(zài)最近的一次(cì)采访中(zhōng),他(tā)再(zài)次表示:“AI可能会让科技行业迎(yíng)来一次(cì)剧烈的(de)洗牌”。

这个(gè)结论是他(tā)在当地(dì)时间2月20日接(jiē)受《In Good Company》节目专(zhuān)访时提出的(de)。

他预期,AI的(de)发展可能(néng)会威(wēi)胁到(dào)谷(gǔ)歌的(de)市占率,因为微软在AI方面的(de)行(xíng)动相当(dāng)迅速。而最(zuì)终(zhōng)科技巨头(tóu)将把AI整合成用户的“全(quán)能助(zhù)手”,包揽(lǎn)一切应用,与人们进行(xíng)沟通并提供建(jiàn)议,可以取代(dài)亚马逊(xùn)、Siri或Outlook等应用。

大(dà)佬口中全能助手的到来可(kě)能尚需时(shí)日,但(dàn)由ControlNet引发的又一次AI绘画浪潮(cháo),让(ràng)AIGC在ChatGPT的话题热点包围中杀出(chū)重围。

ChatGPT之后又一应用杀疯了(le),AIGC或进(jìn)入(rù)可(kě)控(kòng)期(qī),将洗牌(pái)科技(jì)行业?_黑料(liào)正(zhèng)能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠(kào)近

以AI绘画为代(dài)表的AIGC上(shàng)一次(cì)爆火的时候(hòu),还(hái)是(shì)2022年8月,在美(měi)国科罗拉多州(zhōu)举(jǔ)办的新兴数字(zì)艺(yì)术家竞赛中,一(yī)幅名(míng)为(wèi)《太(tài)空歌剧院》的(de)作(zuò)品获奖。

随(suí)后各(gè)大厂(chǎng)商的AI绘画(huà)软件被广大网友熟知并(bìng)体验,Stable Diffusion便是其(qí)中代表。

ChatGPT之后又一应用杀疯了(le),AIGC或进入(rù)可控期(qī),将洗牌科技行(xíng)业(yè)?_黑料正能量

用户们可以在应用中输入一(yī)组关键词或者一张(zhāng)照片,就能(néng)获得一幅(fú)AI创(chuàng)作的画作(zuò)。

作画的(de)关键就(jiù)是所输入的(de)文本。同一(yī)组关(guān)键(jiàn)词也可以创(chuàng)作出很(hěn)多张风(fēng)格不一样的画(huà)作,这让创作的过程就像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不确定的惊喜(xǐ),他们(men)会将生成的美(měi)图当做头像。而另一(yī)部分(fēn)喜欢翻看AI绘(huì)画的“翻车”作品。在社交媒体(tǐ)上(shàng),许多用户(hù)分享(xiǎng)AI“翻车现场”,例如,一(yī)位网友(yǒu)的小(xiǎo)狗照片被AI画(huà)成了“肌肉男(nán)”,还有网友的个人(rén)照(zhào)片被(bèi)AI识(shí)别成了建筑。

而如今随着ControlNet的出现与加(jiā)持,以往AI绘画的填写(xiě)关键词(cí)游(yóu)戏(xì)可能要被(bèi)颠覆了。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技(jì)行业(yè)?_黑料正能量

ControlNet是一位(wèi)正(zhèng)在斯坦福读博的(de)中国人张吕敏创(chuàng)作的一种(zhǒng)基于(yú)控制点的图像变形算(suàn)法,主(zhǔ)要用于数字(zì)图像处理、计算(suàn)机视觉和(hé)计(jì)算机图形学等领域(yù)。

其(qí)SD插件一经发布,在短短的两天(tiān)内便成为了AI绘画领域最新的热点。

在此(cǐ)之前(qián),大家用了很多方法想让(ràng)AI生成的(de)结果尽可能(néng)的符合要(yào)求,但是都不尽(jǐn)如人意,它的出现代表着AI生成开始进入真正(zhèng)的可控(kòng)时(shí)期。

因为ControlNet可以直接提取画面的构图,人(rén)物(wù)的姿势(shì)和(hé)画面的深度信息等。有了(le)它的帮助(zhù),就(jiù)不用频繁的(de)用提示(shì)词来(lái)碰运气,抽盲(máng)盒式的(de)创作了(le)。

通(tōng)俗的说ControlNet相当于给AI绘(huì)画加了“魔(mó)法”,不少博(bó)主的作品(pǐn)已经获得(dé)了大量(liàng)的浏览(lǎn)量,“viggo”就是其(qí)中(zhōng)之一(yī),他(tā)用朋友(yǒu)的照片(piàn)直接带她们走(zǒu)进动漫世界。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能量(liàng)

viggo先用StableDiffusion图片(piàn)转(zhuǎn)文(wén)字(zì)。

再(zài)用Text2Prompt插件拓展找到(dào)对应(yīng)的关(guān)键词(cí);最后用ControlNet插件(jiàn)绑定骨骼开始换(huàn)关键词试效果。

ChatGPT之后又(yòu)一应(yīng)用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

通过(guò)图片就可以看出来(lái),效果十分惊艳。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑(hēi)料(liào)正能量

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

更厉害的是,除了真实的(de)照片,草图也可以加(jiā)上(shàng)“魔法”,知乎大牛“DevPoint”和“逗砂(shā)”介绍到ControlNet还能实(shí)现线稿转(zhuǎn)全(quán)彩(cǎi)图。大(dà)神(shén)张吕敏其(qí)本(běn)尊也亲自回应。

ChatGPT之后又一应(yīng)用杀(shā)疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能(néng)量

不得不说当下(xià)AIGC已经变得越来越(yuè)强大,甚至输出的(de)作品都已经(jīng)能以假乱真了。

02

难辨虚实,AIGC技术力爆发

警惕安(ān)全问题

近日,“苏(sū)州金鸡湖有游艇party”的消息(xī)火遍网络,而经过警方辟(pì)谣(yáo)这所谓的“party”可能是全国第一(yī)起AI绘图诈骗。

由于这个活动(dòng)里(lǐ)面给出的美女照片都是AI制作的真(zhēn)人照片(piàn)绘图(tú),因为太逼真,被大家当成真事(shì)传播了(le)

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可(kě)控期(qī),将洗(xǐ)牌科技行业(yè)?_黑料正能量

不(bù)过仔细观察可以发现,活动发起者(zhě)提供的(de)照片中有个很大的漏洞可(kě)以(yǐ)发现并非真人,而是AI绘图,那便(biàn)是图(tú)片中女性的手指部分有(yǒu)的存在异常。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

有(yǒu)行业(yè)人事表示:“现(xiàn)在因为手(shǒu)指部分的绘画(huà)算(suàn)法比(bǐ)较复杂,AI还不太会画人的(de)手,但最新看到的图片已(yǐ)经有越来越完美(měi)的(de)AI模型出现,以后(hòu)可能就完全没(méi)有漏(lòu)洞(dòng)了。

类似的AI作(zuò)图诈(zhà)骗(piàn)在国外(wài)也(yě)已有(yǒu)发生。据(jù)英国广播公司报道,土耳其地(dì)震期间,有Tiktok用(yòng)户使用AI合(hé)成了儿童受灾(zāi)的假照片发(fā)布(bù)到网络,以此诱骗(piàn)善(shàn)良的人(rén)打赏“捐助(zhù)”从而实施(shī)诈骗(piàn)。

目前随着技术发(fā)展,AIGC已(yǐ)经能做(zuò)出真(zhēn)人照片(piàn)般(bān)的绘图效(xiào)果,如果这样的图片被(bèi)用来(lái)诈骗,将非(fēi)常可怕。

此外AIGC还引发(fā)了很多担忧,一方(fāng)面(miàn),批判者认为(wèi)AI在“学习(xí)”了大量前人的作品之(zhī)后,其创作没有(yǒu)任何情绪和灵魂,难(nán)以和(hé)人类的艺术(shù)创作(zuò)相提并论(lùn)。

另(lìng)一方面,AIGC背后的(de)版权、目前都并没有得(dé)到(dào)有效的解决,还(hái)有AIGC会不会代替(tì)人类(lèi)“至(zhì)高无上(shàng)”的创意。

马斯克也强调,人工智能的安全问题需要得到重视,太晚就来不及了(le)。

03

AIGC下一(yī)站除(chú)了视(shì)频(pín),还有远方

技术都(dōu)是有两(liǎng)面性的,潜在的危害(hài)并不(bù)能掩盖其光辉的贡献。现在看来,人工智能技术将(jiāng)是第四(sì)次工业革(gé)命的(de)核心驱动力量,将(jiāng)创造新的增长奇迹(jì)。

过去一年(nián),人工智能在技术和商业层面都有了巨(jù)大进展,AI绘(huì)画就是人(rén)工智能技(jì)术发生方向性改变的一个代表(biǎo)。其下一站或许就是视频(pín)。

此前,Meta和谷歌(gē)先后发(fā)布了几条引爆科技圈(quān)的短视频。这些视频引发关注(zhù)并非内容做得多优秀,反而都非常简单(dān),比如一匹正在喝水的马,一只画画(huà)的玩具熊,或者一段骑(qí)摩托车(chē)的第一视角录像(xiàng),随便一个有手机的人都可以随(suí)手录(lù)下一段。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑料正能量

但(dàn)这些(xiē)短视频的创作方式(shì)非常(cháng)简单,创作者(zhě)仅仅需要向(xiàng)AI输入(rù)一段话,甚至只(zhǐ)是说一下(xià)要(yào)求,AI就可(kě)以根据(jù)需要生成一段视频。

谷(gǔ)歌发布(bù)的(de)两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要(yào)突出(chū)的是高清(qīng),与Meta的(de)Make-A-Video没有太多的差别。

在Make-A-Video公布了AI生(shēng)成的视频后,AI圈就(jiù)已经玩(wán)了一波梗,一个能够(gòu)做(zuò)出更高清视(shì)频的AI还不足以(yǐ)在(zài)短(duǎn)时间内戳中兴奋点(diǎn)。

Phenaki更加令人震(zhèn)惊的地方在于,它可以制作出超过2分钟(zhōng)的连(lián)贯(guàn)的(de)也(yě)有确切内容(róng)的视频,这(zhè)才是真正让人们(men)感到惊喜的地方。因为无论(lùn)AI生成的视频(pín)多么高清,也只能是为内容生产者提供一个灵感,一个素材,一个过(guò)场动画。

不过(guò)能够制作(zuò)出有(yǒu)具体剧情内容的视频就(jiù)意(yì)味着,一些视(shì)频创作(zuò)由AI代替人工完成已经初(chū)步(bù)有了可能。

当下AI的发展(zhǎn)速度已经超过大部分(fēn)人的想象。内容产业的本(běn)质是供给创造(zào)需求(qiú),AIGC作为全新(xīn)的内容生产方式,可以为内(nèi)容(róng)产业带来(lái)更新的内容风(fēng)格(gé)、更快的生产速度,更(gèng)低(dī)的生产(chǎn)成(chéng)本,这无疑会驱动内容产业的大爆发。

除了AI绘(huì)图、视(shì)频,AIGC技(jì)术还能应(yīng)用于音乐、代码、机器人动作(zuò)等(děng)多种内容形(xíng)式的(de)生成。不难发(fā)现该项技术不仅在(zài)游(yóu)戏等行业(yè)能(néng)得到有效应用,对于下一代互联(lián)网各种元(yuán)素的构建亦(yì)有关键意义。

从商业化(huà)的角(jiǎo)度来看,文化娱乐、教育、传媒等诸(zhū)多(duō)领域,本身就对基于AI的可(kě)视(shì)化内容有强烈需求。

因(yīn)此,AI绘画(huà)及视(shì)频或不(bù)是(shì)结果,而只是AI进(jìn)程中的(de)一(yī)块(kuài)重要(yào)拼图,有望(wàng)在技(jì)术更新的加持下实现更(gèng)大(dà)的应(yīng)用价值。

AI从理解内容,走(zǒu)向了可以生成内容,甚至能够(gòu)创(chuàng)造出独立价(jià)值和独立视角的内(nèi)容。AIGC的再次出圈,更代表着未来的先进生(shēng)产力即将(jiāng)到来(lái)。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料正能(néng)量

04

紧抓大模型与(yǔ)算(suàn)力,牢固AIGC底(dǐ)座

从(cóng)技术的发展也(yě)可以看出,在语言大模型(xíng)、图像大模型之后,多模(mó)态大模(mó)型(xíng)已经成为了新的(de)趋势。

大(dà)模型(xíng)被誉为当前(qián)人工智能(néng)发展的智能(néng)底座,是全球竞争最激烈的研究方向之一(yī),包括谷歌、亚马(mǎ)逊(xùn)、百度、阿里、腾讯等众多头部企业都在竞(jìng)相发力。

不过训练大模型的确(què)价格不菲,以(yǐ)国盛证券(quàn)发布的《ChatGPT需要(yào)多少算力(lì)》报告(gào)估算,GPT-3训(xùn)练(liàn)一(yī)次的成本约为(wèi)140万(wàn)美元(yuán)。而对于一些更大的(de)LLM(大型语言(yán)模型),训(xùn)练成本则介于200万美(měi)元至1200万美元(yuán)高价(jià)之间。

以ChatGPT在2023年1月的独立(lì)访客平均数1300万(wàn)计(jì)算,其对应(yīng)芯片需求为3万多(duō)片英伟达A100 GPU,初始投(tóu)入(rù)成(chéng)本约为8亿美元,每日仅电费就(jiù)在(zài)5万美元(yuán)左右。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑(hēi)料正能量

此(cǐ)外不(bù)论是ChatGPT还是AIGC,都离不开庞大算力支持(chí)。在关注各类(lèi)大模型的发展同时(shí),更(gèng)应该关(guān)注算力(lì)网络的建(jiàn)设。

算(suà两斤大概有多重参照物,2斤有多重?n)力网络正驱动AI产业发展进入史诗级加速(sù)进程(chéng),让AIGC及通(tōng)用AI这一人(rén)工智能(néng)发展(zhǎn)的终(zhōng)极(jí)目标离得更近。

因为算力可以对突破性技术创新提供大力的支持。这方面,多(duō)模态大模(mó)型是典型。作为面向未来(lái)强人工智能、通用(yòng)人工智能的(de)重要技术创(chuàng)新,多模态大模型已经在人工智(zhì)能(néng)领域(yù)提出(chū)了很(hěn)多(duō)年(nián),业界也(yě)有(yǒu)不少(shǎo)技术突(tū)破(pò),但是,多模态大模(mó)型进(jìn)一步往下走,算力需(xū)求呈几何(hé)式上升,一(yī)般的算力基础(chǔ)设施很快将难以胜任。

从图像、文字、语音单(dān)独一项的(de)训练(liàn),到(dào)双模态、三模(mó)态(tài)的跃迁,让人(rén)工智能(néng)可(kě)以灵活应对不(bù)同(tóng)模态的转化、像人与世界交互一样自然,这方面,由算(suàn)力网络来驱动将有(yǒu)明显优势(shì)。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可<span style='color: #ff0000; line-height: 24px;'>两斤大概有多重参照物,2斤有多重?</span>(kě)控期,将洗牌科技行业?_黑料正能(néng)量(liàng)

此(cǐ)外,还有很(hěn)多需要爆发式(shì)增长的(de)算力(lì)来支撑的技术创(chuàng)新,将(jiāng)在人工智能(néng)算力网络支撑下快速推进(jìn)。

AIGC已经(jīng)露出曙光,期(qī)待在大模型和大算力的(de)支持下AIGC能持续颠覆内(nèi)容生产的方式,将创造的边际成本降低,让万众受益(yì)。

未经允许不得转载:腾众软件科技有限公司 两斤大概有多重参照物,2斤有多重?

评论

5+2=