寒潮影响基本结束气温回升 黑龙江降雪逐渐减弱
中新网11月23日电 据中央气象台网站消息,目前,本轮寒潮对中国的影响已经基本结束,预计未来三天...
ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。
正持续进击的Text-to-3D,就被视为继Diffusion(图像)和GPT(文javascript字)后,AIGC领域的下一个前沿热点,得到了前所未有的关注度。
【资料图】
这不,一款名为ChatAvatar的产品低调公测,火速收揽超70万浏览与关注,并登上抱抱脸周热门(Spaces of the week)。
现行beta版本生成的3D模型,能够直接连同PBR材质下载到本地。不仅效果不错,更重要的是免费可玩。有网友惊呼:
由此吸引不少网友纷纷试用并贡献脑洞。有人拿这款产品和ControlNet结合,发现效果细腻写实到有些出乎意料。
这款使用起来几乎零门槛的Text-to-3D工具名叫ChatAvatar,由国内AI初创公司影眸科技团队打造。
据了解,这是全球首php款Production-Ready的Text to3D产品,通过简单的文本,例如一个明星的名字、或是某个想要的人物长相,就能生成影视级的3D超写实数字人资产。
效率也非常高,平均仅需30秒,就能做出一张以假乱真的脸——甚至是你自己的。
未来,生成领域还将拓展到其他三维资产。
并且该模型带有规整的拓扑、带有4k分辨率的PBR材质,同时带有绑定,可以直接接入Unity、Unreal Engine和Maya等制作引擎的生产管线中。
所以,ChatAvatar到底是怎样一个3D生成工具?背后究竟用到了什么技术?
亲身体验ChatAvatar的玩法发现,可以说是真零门槛。
具体而言,只需以对话的形式,在官网上用大白话向ChatBot描述自己的需求,就能按需生成3D人脸,并覆盖一张贴合模型的真实“人皮”。
对话全流程里,根据用户需求,ChatBot会进行引导,尽可能细节地了解用户对所需模型的想法。
体验过程中,我们向ChatBot描述了这样一个想要生成的3D形象:
点击左侧的Generate按钮,平均10s不到,屏幕上就出现根据描述生成的9种不同3D人脸的初始雏形。
随意选择其中一种后,会基于选择继续优化模型和材质,最后出现覆盖皮肤后的模型渲结果,并展现不同光影下的渲染效果——这些渲染在浏览器内实时完成:
用鼠标拖动,还能旋转头部,并放大看更细节的局部效果,毛孔和痘痘都清晰可见:
值得一提的是,如果用户是个提示工程高手,直接在左侧框中输入prompt,同样可以完成生成。
最后,一键下载,就能获得一个可直接接入制作引擎并被驱动的3D数字头部资产:
虽然beta版本还没上线发型功能,但整体而言,最后生成的3D数字人资产与描述内容已经有高匹配度。
官网上还陈列了许多ChatAvatar用户的生成资产,不同人种、不同肤色、不同年龄,喜怒哀乐,美丑胖瘦,各式相貌应有尽有。
总结一下ChatAvatar这款产品生成3D数字人资产的效果亮点:
首先是使用简便;其次是生成跨度大,且五官可改,还能生成与面部贴合的面具、纹身等,譬如这样:
根据官方宣传片介绍,ChatAvatar甚至可以进一步生成超出人类范畴的角色,如阿凡达等影视作品中的角色:
最重要的是,ChatAvatar解决了3D模型与传统渲染软件存在的兼容性问题。
这意味着,ChatAvatar生成的3D资产可以直接接入游戏和影视生产流程。
当然,在正式接入工业流程之前,首轮公测,ChatAvatar已经吸引了数千名艺术家和专业美术人员参与,推特相关话题受到近百万的浏览与关注。
随随便便一条推文,浏览量都能破50k。
积攒了大批“自来水”不是没有原因,看看3D的爱因斯坦之脸,试问谁不说一句真的很像?
要是和ControlNet结合,生成效果不亚于单反相片直出:
已经有不少用户体验后,开始畅想将这个Text-to-3D工具大规模应用在游戏、影视等工业应用上了。
据了解,用户反馈会成为ChatAvatar团队快速迭代和更新的重要依据,形成数据飞轮,以便及时提供更加完整和贴近需求的功能。
事实上,对于此前的3D行业设计师或公司来说,大部分AI文字转3D应用并非效果不好,但实际落地到工业设计流程上,还是有不少难度。
这次ChatAvatar能如此出圈,背后究竟有什么技术上的原因?
都说AI要替代人类,事实上仅仅就Text-to-3D领域,就并非那么容易替代。
最大的难点,在于让AI生成的东西从标准上符合产业对3D资产的要求。
这里面的产业标准怎么理解?从专业3D美工设计的视角来说,至少有三个方面——
质量、可控性和生成速度。
首先是质量。尤其是对于强调视觉效果的影视、游戏行业来说,要想生成符合管线要求的3D资产,拓扑规整度、纹理贴图的精度等“行业潜规则”,都是AI产品第一道必须迈过去的坎。
以拓扑结构的规整度为例,这里本质上指的是3D资产布线的合理度。
对于3D资产来说,拓扑的规整度,往往直接影响物体的动画效果、修改处理效率和贴图绘制速度:
据行内3D美工设计介绍,手工重拓扑的时间成本往往比制作3D模型本身更高,甚至按倍数以计。这意味着即使AI模型生成的3D资产再炫酷,如果生成的拓扑规整度达不到要求,成本就无法从根本上得到降低。更别提纹理精度。
以目前游戏、影视行业普遍要求的PBR贴图为例,包含的反射率贴图、法线贴图等一系列贴图,相当于2D图像PSD文件的“图层”,是3D资产流水线生产必不可少的条件之一。
然而,目前AI生成的3D资产往往是一个“整体”,少有能按要求单独生成符合产业环境的PBR贴图的效果。
其次是可控性,对于生成式AI而言,如何让生成的内容更加“可控”,是CG产业对于这项技术提出的又一大要求。
以大众所熟知的2D产业为例,在ControlNet出现之前,2D AIGC行业一直处在一种“半摸黑前进”的状态。
也就是说,AjsI能生成指定类别的物体画面,却无法生成指定姿态的物体,生成效果全靠提示工程和“玄学”。
而在ControlNet出现后,2D AI图像生成的可控性获得了突飞猛进的提升,然而对于3D AI而言,要想生成对应效果的资产,很大程度上依旧得依靠专业的提示工程。
最后是生成速度。相比3D美工设计而言,AI生成的优势在于速度,然而如果AI渲染的速度和效果无法与人工匹敌的话,那么这项技术依旧无法给产业带来收益。
以当前在AI技术上颇受欢迎的NeRF为例,其产业化落地就面临速度和质量的兼容性难题。
在生成质量较高的情况下,基于NeRF的3D生成往往需要相当漫长的时间;然而如果追求速度,即使是NeRF生成的3D资产便完全无法投入产业使用。
但即使解决了这个问题,如何在不损失精度的前提下让NeRF与传统CG行业的主流引擎兼容仍然是一个巨大的问题。
从上面的产业标准化流程不难发现,大部分AI文本转3D应用落地存在两大瓶颈:
一个是需要手动完成提示工程,对于非AI专业人士、或不了解AI的设计师来说不够友好;另一个是生成的3D资产往往不符合产业标准,即使再好看也无法投入使用。
针对这两点,ChatAvatar给出了两点具体有效的解决方案。
一方面,ChatAvatar实现了除手动输入提示工程外的第二条道路,也是更适合普通人的一条捷径:通过“甲方模式”直接对话描述需求。
团队官方推特介绍称,为了实现这一特性,ChatAvatar基于GPT的能力,开发了一种对话描述转人像特征的方法。
设计师只需要不断和GPT聊天,描述自己想要的“感觉”:
GPT就能自动帮忙完成提示工程,将结果输送给AI:
换而言之,如果说ControlNet是2D行业的“Game Changer”,那么对于3D产业来说,能实现文本转3D的ChatAvatar,无异于行业的游戏规则改变者。
另一方面更为重要,那就是ChatAvatar能完美兼容CG管线,即生成的资产在拓扑结构、可控性和速度上都符合产业要求。
这不仅意味着生成3D资产之后,下载的内容可以直接导入各种后期制作软件进行二次编辑,可控性更强;
同时,生成的模型和高精度材质贴图,还能在后期的渲染中达到极为逼真的渲染效果。
Deemos影眸科技,赞88
为了实现这样的效果,团队为ChatAvatar自研了一个渐进式3D生成框架DreamFace。
其中的关键,在于训练该模型用的底层数据,即影眸科技基于“穹顶光场”采集到的世界首个大体量、高精度、多表情的人脸高精度数据集。
基于这个数据集,DreamFace可以高效地完成产品级三维资产的生成,即生成的资产带有规整的拓扑、材质,带有绑定。
DreamFace主要包括三个模块:几何体生成,基于物理的材质扩散和动画能力生成。
通过引入外部3D数据库,Dre编程amFace能够直接输出符合CG流程的资产。
上述两大技术瓶颈的解决,本质上进一步加速了AIGC洪流下,“生成”将取代“搜索”的时代趋势——
影眸团队认为,“生成”将成为新一代数字资产的获取方式。
此前,我们需要找到一张符合需求的图片或者资产时,通常会使用搜索引擎进行查询。
ChatAvatar项目主页上展示的巨大的“搜索框”和整齐的资产卡片,看似搜索引擎,但实际上是一种与搜索截然不同的资产查找方式。
影眸科技CTO张启煊对此介绍:
ChatGPT一石激起千层浪,进入AI2.0时代之后,人们的目光也投向包含图像、视频、3D等信息的多模态AI。
仅就3D生成领域而言,无论是影视还是游戏行业,3D内容生产和消费市场已经拥有足够大的规模,但在制作层面却因技术难度遭遇掣肘。
譬如,文本领域大行其道的Transformer,在3D生成领域的使用还相对有限。
去年夏天,当文生图领域因Diffusion Model取得成绩后,人们开始期待文字生成3D有同样惊艳的表现。一旦生成式AI的3D创作技术成熟,VR、视频等的内容创作都将起飞。
事实上,无论是科技巨头还是初创公司,的确都在朝Text-to-3D这个方向暗暗发力。
去年9月,谷歌发布了基于文本提示生成3D模型的FreamFusion,声称不需要3D训练数据,也不需要修改图像扩散模型。紧随其后,Meta也推出可以从文本一键生成视频的Make-A-Video模型。
后来的Text-to-3D的AI模型队伍中,还先后出现了英伟达Magic3D、OpenAI最新开源项目Shap-E等,今年8月将举办的计算机图形顶会SIGGRAPH2023所展示的论文,也有多篇与Text-to-3D有关。
影眸科技有关文本指导的渐进式3D生成框架DreamFace的论文,就是其中之一。
而ChatAvatar,也是目前为止最集中在3D数字人资产方向的生成式模型产品。
其背后的AI初创公司影眸科技,2020年孵化自上海科技大学MARS实验室,成立后获得奇绩创坛与红杉种子的两轮投资。
公司专注于专注于计算机图形学、生成式AI的研究与产品化。2021年,AIGC还未掀起巨浪之时,公司就已经推出国内首个AIGC ToC绘画应用Wand,产品一度登顶AppStore分区榜首。
而这个颇具前瞻性,且已在业内小有名气的团队,平均年龄只有25岁。
将首个商业化场景具体锚定在数字人后,ChatAvatar是他们乘AIGC东风在该方向的最新进展。
作为一个新推出的产品,ChatAvatar在兼容性、完成度和精度等产品效果层面,都超出了影眸团队预期。然而在吴迪口中,行至此处的过程“很狼狈”。
主要原因不外乎“缺人”一事。目前,影眸已经在多类别3D生成技术上取得了进展,下一步还计划推出“3D生成大模型”。
需要持续向前推进,就需要更多的工程化团队、技术美术和拥抱生成式AI的产品人才加入团队。作为一个以研发为背景主基调的团队,这样的人才仍然紧缺。
“人是万物的尺度,”吴迪表示道,“我们需要更多志同道合的人加入,共同推动3D领域的创新发展。”
可以看到,ChatAvatar背后技术从无到有的搭建,揭示了一家AI初创公司的不断创新;而从这家公司对人才的渴望以小见大,更揭示着AIGC浪潮下,每一个细分领域想要从水下浮出水面的心。
你愿意拥抱生成式AI,成为Text-to-3D领域的Game Changer吗?
标签:
上一篇 : 弱降水先行,12日河南将迎30℃高温
下一篇 : 最后一页
日前,据路透社报道称,有业内知情人士透露,大众汽车集团将重组其软件子公司CARIAD的高层团队,以此解决软
05-09 14:21:30
记者5月9日从哈尔滨市松北区政府了解到,哈尔滨市松北区利民学苑小区租户私拆承重墙事件发生后,哈尔滨市委
05-09 13:53:52
在利物浦1-0战胜布林特福德的赛前,现场播放了英国国歌,以庆祝查尔斯三世加冕,但现场球迷响起了嘘声。摩
05-09 13:06:08
房屋出卖人和买受人均应自觉遵守国家房地产登记制度及有关政策,避免引发不必要的民事纠纷甚至民事诉讼,最
05-09 12:51:28
农业是人类赖以生存的基础产业,也是绿色低碳发展的重要领域。伴随全球气候变化和环境污染的日益严峻,农业
05-09 12:00:19
2024年是上海国际赛车场投入使用二十周年。暂别三年后,F1中国站的回归无疑是车迷最大的期待。记者近日从上
05-09 11:45:29
1、燕飞逃走。2、白玉堂服长沙任职。以上就是【五鼠闹东京真实原型,五鼠闹东京结局】相关内容。
05-09 11:13:35
你们好,最近小活发现有诸多的小伙伴们对于打开别人手机摄像头的网站,打开别人手机摄像头这个问题都颇为感
05-09 11:17:10
当地时间6日,美国得州一家购物中心发生枪击案。海外网5月8日电据美国《时代周刊》网站7日消息,当地时间6
05-09 10:49:20
1、客户份额在英文中一般用SOW(ShareofWallet)SOW有下面四种常见形式:功能:客户通常知道他们想要什么,但
05-09 10:24:25
当地时间6日,美国得州一家购物中心发生枪击案。海外网5月8日电据美国《时代周刊》网站7日消息,当地时间6
05-09 10:10:01
关于我省自学考试商务管理、金融管理等4个专业涉及的26门课程试卷结构有关问题的通知各地级以上市自学考试
05-09 09:24:48
【国泰君安:通信板块把握未来有潜力超预期、高景气、运营商三大主线】国泰君安最新研报表示,2023年初至今
05-09 09:16:14
【巴菲特又减持!芒格刚提及比亚迪是何信号?】据港交所最新文件,伯克希尔哈撒韦公司在5月2日出售了196 1
05-09 08:17:03
1、没什么好或不好的,都是迷信,黄鼠狼只是一种鼬科动物,和貂皮的材料水貂和宠物貂是差不多的动物,没听
05-09 07:43:05
财联社5月9日讯(编辑夏军雄)当地时间周一(5月8日),美联储发布了《金融稳定报告》,报告称,各家银行对
05-09 07:31:39
2月7日,中国游客抵达阿联酋首都阿布扎比的法拉利世界主题公园。官方数据显示,阿联酋旅游业已经强势回归,
05-09 06:50:42
银联号是指任何一家发卡银行所发行银行卡的卡号。查询方法:用户可以拨打相关银行的客服电话,选择人工服务
05-09 05:47:39
1、保险小编帮您解答,更多疑问可在线答疑。2、为进一步促进残疾人的就业工作,根据市残联、市财政局、市地
05-09 04:14:42
1、核心表现是患者认为一个现实的人(多数是亲属)被另外一个人所冒充或取代,这两个人同时都存在,而且长
05-09 01:45:22
5月8日柳州市自来水有限责任公司发布了一则停水公告具体内容如下:因供水管道施工,计划从2023年5月9日13时
05-08 23:10:08
当年轻人登上时代的舞台。文 严锦彦游戏行业相信创意。只要你有一个好的idea,并具备将其实现的能力,那这
05-08 22:15:42
正式完结一周后,剧集《漫长的季节》依旧后劲十足,日均播放量维持在2000万以上,每天仍有数万人涌入豆瓣为
05-08 21:11:36
挖贝网5月8日,中农华威(835911)发公告称,公司董事会于2023年5月5日收到总经理游锡火递交的辞职报告,自
05-08 20:40:49
迪尔化工拟使用额度不超过8000万(含本数)的闲置募集资金购买理财产品,存款,理财产品,迪尔化工,自有资金
05-08 19:57:27
南方网讯(记者 黎妙娟通讯员 邵坚宁)5月8日,首届中国超高清视频产业投融资圆桌会在广州举办。中央广播电
05-08 19:25:20
智通财经APP讯,远大医药(00512)发布公告,该集团在眼科领域的合作伙伴台新药股份有限公司公布其用于抗炎镇
05-08 18:41:12
去年12月小米举行了Xiaomi13&MIUI14旗舰新品发布会,除了大家所关注的手机与系统之外,最令人关注的产品就
05-08 18:08:36
《小美人鱼》官方公布了电影的正片片段,爱丽儿与埃里克王子泛舟于湖上,小伙伴们正在营造氛围、鼓励王子亲
05-08 17:34:12
豪车制造商宾利首席执行官警告称,英国未能吸引电动汽车初创企业或大型电池制造商的投资“令人担忧”。...
05-08 17:15:16
5月8日,未势能源官微宣布,三款加氢口产品(35MPa:标准流量 大流量,70MPa:大流量),按照《GB T26779-2
05-08 16:39:01
1、农业增加值: 指项目在报告期(一年)内农林牧渔及农林牧渔业生产货物或提供活动而增加的价值,为农林
05-08 16:04:55
5月7日,由宁波大学主办的大桥防船撞重大技术成果发布会暨重大工程结构健康与安全高端论坛在宁波举行。会上
05-08 15:49:52
据中国经济网石家庄5月8日综合报道,8日,《河北日报》发布省委常委、秘书长严鹏程署名文章《带头做到“...
05-08 15:06:51
江苏泗阳县的徐医生在接诊一名6岁女童时发现孩子身体异常,判断其很可能遭遇侵害后,第一时间留存证据线索
05-08 14:57:30
天眼查App显示,5月5日,好孕天使(北京)医疗科技有限公司因违法发布国外代孕广告,被北京市丰台区市场监
05-08 14:14:45
中国质量新闻网讯由安徽省产品质量监督检验研究院(以下简称“安徽省质检院”)自主筹建的安徽省新能源...
05-08 13:41:27
摘要:2023年05月08日兆龙互连(300913)换手率大于8%,主力资金净流出269 12万元。换手率大于8%说明了该股
05-08 13:01:41
LarianStudios已确认博德之门3Xbox端口正在开发中,但与分屏合作相关的技术障碍阻碍了它的正式发布。在昨天
05-08 12:26:02
1、肠炎是指由细菌、病毒、真菌和寄生虫引起的胃肠炎、肠炎和结肠炎,常表现为恶心、呕吐、腹痛、腹泻、脓
05-08 11:59:31
淄博市一季度GDP突破1000亿元同比增长4 7%据淄博市统计局消息,淄博市统计局近日发布数据显示,根据市级生
05-08 11:52:52
联化科技(002250)05月08日在投资者关系平台上答复了投资者关心的问题。
05-08 11:29:16
摄影:徐晚晴摄影:徐晚晴红网时刻岳阳5月8日讯(通讯员徐晚晴彭柳)以“椒”为桥梁,以美食为纽带,讲...
05-08 11:06:23
本报北京5月7日电 (记者杨彦帆)为促进和规范中医养生保健服务发展,保护人民健康,国家中医药管理局近 ">
05-08 10:35:41
1、哈勒可用于治疗前列腺炎。2、哈乐又名坦索罗辛,是一种受体阻滞剂,对尿道平滑肌和逼尿肌有缓解作用,主
05-08 09:55:33
每天一到中午饭点,厦门新圩镇的农村小路总能看见一个个穿着红马甲、骑着电动车的姑娘忙碌的身影。这26名姑
05-08 09:57:24
BOPP薄膜是一种应用非常广泛的软包装材料,2022年中国BOPP薄膜产量达459 9万吨,同比增长12 83%,出口量达5
05-08 09:33:42
一项追踪采取价优于量策略的公司的指数最近表现出色,表明该策略取得了成功,以及投资者似乎也青睐这种策略
05-08 09:03:22
接猫前要做什么准备1、关于健康问题:在接到猫的第一时间,判断猫咪是否健康,有没有做了驱虫2、接猫的工具
05-08 08:39:34
无差别就业,南京有一家以聋人咖啡师为主的本土咖啡品牌“无声”小店名声响“残健共融”飘咖香□南京日...
05-08 07:51:00
日前,据路透社报道称,有业内知情人士透露,大众汽车集团将重组其软件子公司CARIAD的高层团队,以此解决软
2023-05-09
记者5月9日从哈尔滨市松北区政府了解到,哈尔滨市松北区利民学苑小区租户私拆承重墙事件发生后,哈尔滨市委
2023-05-09
在利物浦1-0战胜布林特福德的赛前,现场播放了英国国歌,以庆祝查尔斯三世加冕,但现场球迷响起了嘘声。摩
2023-05-09
房屋出卖人和买受人均应自觉遵守国家房地产登记制度及有关政策,避免引发不必要的民事纠纷甚至民事诉讼,最
2023-05-09
农业是人类赖以生存的基础产业,也是绿色低碳发展的重要领域。伴随全球气候变化和环境污染的日益严峻,农业
2023-05-09
昨天市场情绪总龙头光大证券高开低走,全天成交额达124亿,呈现较为明显的价量失控的疑虑。后续能否重新...
概念特点1、 定义:纤维是天然或人工合成的细丝状物质,纺织纤维则是指用来纺织布的纤维。2、 纺织纤...
中新网西宁11月21日电 题:青海水润高原:从“大动脉”到“毛细血管”的精准管理 作者 谈林明...
中新网西宁11月21日电 (记者 张添福)青海省卫生健康委员会21日消息,该省第3例本土确诊病例经过20...
新华社华盛顿11月20日电 通讯:“留在中国的决定让我拥有一段值得讲述的人生”——留华美国学生韩...
据安庆市人社局统计,截至6月底,该市在职企业职工养老保险参保人数达54 9万人,完成年度目标任务106 ...
中新网11月23日电 据中央气象台网站消息,目前,本轮寒潮对中国的影响已经基本结束,预计未来三天...
Copyright © 2015-2022 南方纤维网版权所有 备案号:粤ICP备18023326号-21 联系邮箱:855 729 8@qq.com