你好,我是一名AI设计师(你好,我是一名ai设计师作文英语翻译)

关闭
观看更多
更多
退出全屏

视频加载失败,请刷新页面再试

刷新

01

二十平米房间里的一个想法

2019年12月,58同城用户体验室里,几名平均年龄接近40岁的男人,正在讨论如何创造一名AI设计师。

这是一个二十平米左右的房间,室内温度在十六摄氏度上下。电视中播放着演示文档,散发着的荧光打在每个人的身上,这光线也让人感到浑身发烫。

老何是58同城用户体验设计中心的负责人,他站起身开始在房间内踱步,桌子上的摆件一直握在手中。他看着屏幕里演示文档的最后一页,“这件事我们想的很清楚。”语气坚定沉着。在场的还有肖指导,58同城技术工程平台群,TEG基础体验技术部负责人,以及产品设计师丁楷镔。相同的场面在一个月前同样出现过,在相同的房间里,聚集了用户体验设计中心各设计部的负责人。在同样的空间里,不同的时间,面对着不同的人,都在讨论一件事,创造一名AI设计师。

近些年,人工智能的话题不绝于耳,从苹果发布人工智能语音助手Siri,到三星对其OS语音助手战略升级为Bixby,人工智能忽如一夜春风来。从自然语义到图像处理,随后看到2016年阿里巴巴人工智能设计实验室发布了第一款AI智能设计师,鹿班。京东发布了自己的智能设计平台,玲珑。人工智能领域在近年的爆发式增长,让所有人看到了一条可以弯道超车西方国家的路径,同时也看到了企业的新护城河。中国互联网时代也正式向着人工智能时代迈进,那些沉默数年的技术在这几年中走向台前,走向大众的视野,并走进人们的生活,拉开了崭新时代的序曲。

在整个行业趋势的驱动下,创造一名AI设计师用于服务58同城的业务势在必行。当下的课题是“场景”,所有的技术应切实的服务于用户的真实诉求。正如一名身手矫健,经验丰富的冲浪手,新技术犹如海浪来袭,站在巨浪前更应该保持冷静与克制,在旋涡中辨别出最佳路线。

经过一个多月的筹备,在一间可以容纳二十多名人员的会议室里聚集了这名AI设计师的所有创造者。在这场会议中讨论了这名AI设计师的能力,人脸识别、图像合成、智能抠图等。白板上是密密麻麻的流程图,这场讨论持续了两个多小时,这场讨论对于每个人的感受都不尽相同。而对于这个项目的产品设计师来说,更是充满了无限的未知与无尽的挑战。这是他加入58同城的第二年,在这之前他就职于三星,负责ONE UI的设计工作,在三星的工作经历中,他接触了人工智能语音助手Bixby和IOT,深知人工智能这个领域在当下的难点,即从人工走向智能。会议结束后,他拍下白板上的会议笔记,笔记中关于这名AI设计师的描述犹如无垠的星际,在这其中藏匿着尚未发现的北极星指标。

02

在疫情中诞生的第一个版本

2020年2月,智能抠图上线,这是她的第一个能力,也是迄今为止最早服务于业务的功能。为了使这个功能在上线后能解决绝大部分场景的图片,让用户真切的体会时间上的节省和效率上提升。在功能研发阶段,产品设计师和工程师不断收集业务图像资源和公共图像资源,持续训练AI设计师的图像识别能力,同时追求更快的速度,从5分钟10张图片,到8秒钟10张图片,最后到5秒钟10张图片,如果24小时不间断地执行,每天可以完成172800张图片。而每一次的优化都在无限接近终极目标。

为了实现这个能力,效能平台线后端技术负责人王剑飞找来了资深工程师魏磊磊的算法团队。当时58同城的用户体验设计中心面临着一个非常棘手的问题,在过去几年里,二手车业务需要大量的设计资源来人工抠图,一年有3000张左右的图片量,有时需要十几名设计师在极短的时间内完成。按照1张图5分钟的时间成本计算,1名设计师则需要花费1个月工作时间完成3000张的图片量,而这只是这条业务线下的某一个子业务。在58同城旗下的优信二手车业务,平均每天需要录入3000张车辆抠图及模糊图片到系统中,在这样庞大的数量面前,人工处理的成本和瓶颈显而易见。

虽然整个团队很清晰业务的诉求和如何切入业务场景的方法,但第一个版本上线时并没有达到理想的效果,图像结果不完整,识别存在较大误差等问题,几乎很多问题是在上线后并行修复及研发。在2020年第二季度的复盘会上,产品设计师认为整个产品的初期过于追求大而全,精力上的分散无法集中细分功能点进行优化。而就在困于阶段性成果体现不足的时候,优信二手车的技术团队通过集团内部宣传渠道联系到了算法负责人魏磊磊和后端工程师程旭。

与优信二手车的沟通是在茶水间进行的,下午的时间有很多员工在这里进行需求沟通或者面试。所有人围绕在一个小圆桌旁讨论了关于调用智能抠图能力的需求。这次的会议时间很短,大概只有十五分钟左右,当得知每天有3000张左右的车辆图片需要录入系统时,相比较当时几十张的量级来说,这将会是一个非常典型的案例。

而这个能力的正式输出是在2020年的11月份。上线的第一天就帮助业务完成了一千多张抠图,随着时间流逝,每天都稳定在接近4000张的量级,截止目前,已完成了将近30万张的车辆图片抠图。按照市场定价标准,抠图的人力成本为5元,目前这名AI设计师已节省150万元。

目前抠图功能上线了通用目标抠图模型,针对新车和二手车业务上线了车辆抠图模型,同时对不同业务需求特点基于抠图结果进行了定制化开发,比如针对二手车业务增加了背景虚化功能,针对新车业务添加了车辆阴影自动生成叠加功能,提升整体观感。除此之外,抠图模型同时应用在了智能生成模块中,利用抠图结果对筛选出的模板进行排序。《图像AI技术在斑马系统中的应用》作者:魏磊磊智能抠图属于深度学习中,salient object dection(SOD)的一种实际应用,也是一个相对热门的研究领域。其主要任务是,输入一张rgb图像,输出该图像中的显著性目标掩模(mask图),即一张只含有0和1像素值的二值图,0是背景,1是目标。在实际应用中,还要把原图和mask图进行融合。经过我们的前期调研,最终决定了选择了BASNet( Boundary-Aware Salient Object Detection )作为基础模型,原因是该模型对显著性目标的完整性,目标的边缘,都有很好的保持。另外我们还进行了一些改动,最终上线到了斑马平台。BASNet模型结构,可以看到它由两个模块组成,左边是encode-decode结构,用于粗分割,右边是残差结构,用于精细化调整。其中左边的结构在每一个decoder处都会有一个side output,通过上采样之后和ground truth计算loss,但送入右边refine结构的还是具有最高分辨率的side output,因为它的准确率最高(不是通过直接上采样得到)。右边的残差结构则是利用了残差思想,学习predict和ground truth之间的差,比学习predict更容易。《斑马系统智能抠图算法介绍》作者:杨松03我们做的不是Photoshop,是智能化的营销创意工具画板编辑器的核心能力由前端技术工程师乔纯美负责,以及设计文件的解析工作由后端工程师程旭、佟玉鹏、鲁晓磊负责。在整个编辑器的研发过程中,工程师们几乎解析了设计文件中的绝大部分效果,比如从设计文件中获取B-Box坐标定位,在前端页面尽量接近完美的展现出来,几乎在产品研发的所有版本中都要不停地去优化。在智能抠图功能上线后,产品战略发生了改变。模板编辑器作为AI设计师最核心的功能,承载了整个产品几乎一半的功能,同时也是用户使用的最频繁的功能。而对于模板编辑器的产品定位也最为清晰,它的目标是整合集团内的所有设计资产,并通过数字化方式提供给需求方使用,使用者不必担心版权风险,也无需担心紧俏的设计排期。这些是从效率层面考量。更重要的是,整个模板中心及模板编辑器可提供给集团内部业务和外部商家,是一整套营销创意资源解决方案。在供给侧有专业的设计人员支持,在需求侧有业务商家承接,同时提供基于AI能力的美学评价系统以及数据分析能力,来辅助用户进行决策。在编辑器的研发过程中,面临了极大的挑战,其中优化编辑器是一件最煎熬的事情,掺杂了前端交互逻辑,后端解析逻辑,算法匹配逻辑等一切难题。那段日子里,整个团队里经常听到的三个字就是,太难了。最为基础的源文件解析及规则前前后后也改了四五遍。而在产品中的另一项核心功能智能生成里,工程师将智能裁切初步与智能生成进行结合,将我们在做智能抠图时沉淀下来的图像识别数据和大量的图像数据训练模型结果体现在智能生成的功能里。通过判断图片主体类别与行业标签关系进行分类,再进一步识别图片中非主体区域外的空间,最终确定新增或替换元素所摆放的位置,从而生成全新的图片。区别于市面上绝大部分的智能生成产品,如阿里巴巴鹿班、京东玲珑等。我们这名AI智能设计师,已经实现将新增元素与主体元素进行区分,并完全不会遮挡主体图片的能力。同时在不断地学习训练中,如不间断的去执行智能生成,平均每天可制作14400张有效创意素材。对于图像裁切这件事,我们可以把它定义为两步:1.生成候选子图,2.设计美学评分模型。对于第一步,我们用了为数不多的公开数据集CPCDataset以及GAICD-Dataset。其中,CPCDataset中每张图片含有24个crop-image,并且每一个crop-image都有6位专家对其进行打分。第二步是设计美学评分模型,早期的研究通过利用一些摄影知识来实现美学评分,比如一些构图规则(三分法及中心法)将美学评分学习这件事拆成了对于构图好坏的学习(composition-aware)以及对于显著性区域的学习(saliency aware)。Ranking Loss:现有2个crop-image:Xt和Xk, Φ(X)代表X对应的美学评分,原始标签中y(Xk) > y(Xt)。Ranking loss就可以这样理解:当Φ(Xt) > Φ(Xk),  max{0, 1 + Φ(Xt) – Φ(Xk)} > 1, 网络会持续优化,当Φ(Xt) < Φ(Xk), 说明网络预测正确,但是希望这2个还能拉开一定的差距(此处这个间隔是1),所以当两者之差小于1的时候,网络还会继续去拉大这2个的差距,当两者之差大于1的时候,loss就为0不优化了。Saliency-Aware Loss:其中,HW是图片的高和宽,si,j是(i,j)处的显著性图得分,pi,j是(i,j)处的美学评分图。是pi,j在不同构图分区的标准差。那么Saliency-Aware Loss可以这样理解:此时目标不在显著性区域,(1-si,j)会很大,那么网络就会去抑制,使得变小,换句话说,不是显著性的区域,那么无论把它放在任何一个构图分区,它的得分都不应该有剧烈的波动。注意显著性图是事先生成的,不会所以si,j不会参与梯度更新。此时目标在显著性区域, (1-si,j)会是个很小的数,所以这个时候就允许有很大的了。也就是说,如果是显著性区域,那么它的摆放应该是和构图有联系的。《基于美学的图像裁切ASM-Net》作者:郭炜04你好,我是一名AI设计师任何新技术的诞生都是依托于新场景的出现,而推动社会向前不断发展的也绝对是技术的变革。到二零二一年的四月份,这名AI设计师所提供的能力正在服务着集团内的各业务,在智能生成功能上线后的第一个月的时间里,初步提升了设计人员15%的工作效率,在第一个季度中,整体提升了31%的工作效率,而在第二个季度提升已经达到了43%,对周环比数据的长期观察,也逐渐趋于稳定。在满足于业务的基础诉求之后,产品本也开始逐渐探寻更多的应用场景和与业务结合的可能性。创造者们对这名AI设计师赋予了愿景和使命,愿景:让创意更理解商业;使命:简单、易用、高效的创意营销工具。在未来这名AI设计师将会更加专注于基础功能的完善,底层逻辑也会更加稳定,并不断接入更多业务场景,同时丰富自身的创意素材来满足不同场景接入时的承接能力。我们无法给这名AI设计师定一个级别,因为基于它目前所能做到的程度,还没有任何一名设计师可以超越。在核心功能整体上线后,我们的产品和工程师们经常会去询问用户使用中遇到了哪些困难或者有哪些改善建议。很多用户都发来了信息。二手车优信拍使用斑马提供的智能抠图服务实现了车源图片背景虚化的功能,优信拍业务需要隐藏拍卖车辆除本身车况之外的全部信息,例如周围环境、地点等。斑马的智能抠图服务完美支撑了该业务逻辑的诉求,每日节省人工虚化工作3000张左右,保护信息安全的同时提高了审核人员的体验。——汽车事业-汽车技术部-赏宇使用斑马平台模板中心制作推广物料,可以自主选择物料模板,自主更改页面文字内容、支持线上审核、修改等。对于我们运营而言,大大节省了物料设计沟通、跟进、修改成本。提高资源位上线效率。 提几点小建议,希望能够优化:1、模板中心物料建议丰富场景类别;2、同类别物料建议定期更新;3、可支持运营根据具体需求自主设计物料;4、审核响应效率希望能够稍提高——用户价值增长部-价值增长部-刘旭斑马设计平台是运营同学的福音,效率提升平台。运营对于图片素材的需求多且杂,在斑马设计平台的模板中心运营同学对于简单的图片素材,可以自由配置达到快速上线,极大的提高运营同学的工作效率。——用户价值增长中心-用户服务部-何燕妮再次回想起2019年12月,在二十几个平米的房间里产生的想法,到现在这款AI智能设计师走到台前,凭借一己之力服务于众多用户。正如耐克创始人菲尔·奈特所说的那样:“当你创造了某项事物,当你改进了某项东西,当你传递了某种思想,当你为陌生人的生活增添了一些新事物或服务,让他们更加开心、健康、安全和满意,当你干净利落地按照理所应当的方式解决上述问题,你就会更多地参与到宏观人类大舞台上。”我们称这名AI设计师为:斑马智能设计平台,秉承着让创意更理解商业的理念,从而打造的一款简单、易用、高效的创意营销工具。欢迎访问:banma.58corp.com感谢所有该项目参与者灵魂导师:何潇、肖育前、李岩、崔登学;研发团队:王剑飞、孙东、乔纯美、李楠、程旭、佟玉鹏、鲁晓磊、魏磊磊、杨松、郭炜;设计团队:高燕、李钰、牛莉娜🙋一起聊设计 🙋‍♂️

高质量,学知识的设计行业群

设计行业一手资料

设计大厂最直接内推

定期大咖直播0门槛扫码进群!期待与更多优秀设计师一起成长🤩

0
分享到:
没有账号? 忘记密码?