Sora再不向大伙儿开放,就真要被同行们给“碾压”了。。。
一出来,网友们就直接把它和Sora放在一个擂台上,让人意外的是,可灵AI竟然一点都不输,有的时候效果比Sora还要好一点。
还有同样是“拉力赛车”的画面,可灵的理解比Sora更贴合原意一点。咱们能很明显看到,Sora画面里的车在原地打圈,而可灵生成的赛车是真的有在赛道上飙。
相较于Sora,可灵AI还会更适合咱们中国宝宝体质一些,像大熊猫这类的中国元素,它也能迅速get到。
像是它生成人在潜水时的瞬间,脸部周围气泡变化跟真的一样,在整个大幅度运动过程中,脸部也没出现啥畸变。
还有房间爆炸时,镜头推进的画面,整得人都有种看好莱坞大片的错觉了。
看到这儿,不知道差友们什么感受,反正世超已经有点儿坐不住了,立马托朋友从快手那要来了个内测资格,也顺便登上了Luma的试用界面,准备亲自上手试试这两个AI,看看它们到底有没有传说中的这么厉害。
那咱也不废话了,直接在它俩各自的地盘上开测。
到了Luma这儿,画风就突然变得诡异了,男嘉宾就跟有超能力一样,啥餐具都不用就开吃了,而且嘴巴动得也非常不自然。
本以为Luma要大施拳脚了,没想到它一上来就拉了坨大的。
让它生成一段“外星人大战机器人”的画面,还是那个老毛病,同一个人物,一会儿变成机器人,一会儿变成怪兽,全程都没看到打斗的痕迹。
同样的提示词喂给可灵,它倒是把战斗的场面给整出来了,就是有点经不起细看,手里拿的刀都是软的。。。
各自擅长的领域比完了,那紧接着来第二回合,考验下这俩AI对物理世界的理解程度。
要不说全靠同行衬托,对比之下可灵AI的效果就强多了。有猫,有睡觉的人,硬要扣缺点的话,就是没怎么看到猫和主人之间的互动。
后面世超又试了好一些,发现在一些简短的提示词跟前,快手可灵的表现都还不错,比如玩偶熊在瀑布前弹吉他,小样骑自行车等等。
Luma这边就跟使唤久了,想罢工一样,各种Bug都出来了,小熊弹个吉他都能弹出幻影来。
还把羊自个儿变成了自行车。。。
更抽象的是,因为Luma有图片输入,在试的时候总能整出来不少乐子。比如让它给猪猪侠的表情包整个后续,搞到一半就给整成惊悚片了。。
还有经典的“外国老头nice”梗图,他喝可乐是这样子的,多少有的鬼畜。
甚至还有网友给各种梗图,都脑补上了后续。
不知道大伙们有没有注意到,虽说Sora之后,类似的AI是一个接一个,连字节、阿里这样的大厂们,都抢着上这个赛道。
但大部分厂商在宣布自己也有这种模型后,几乎就很少有进一步的动作了。
像是学图片AI一样收会员费,根本就cover不掉它的成本,据调查机构FactorialFunds称,以Sora为例,它30亿参数(主流猜测)的训练成本,比1.8万亿参数的GPT-4还要多。
这不,世超立马就想到了一个点子,不如学一学这次的Luma,玩玩抽象,指不定流量就来了。(狗头)