专栏观察

昇思MindSpore两周年:一个学习型开源社区的成长记事

撰文 / 张贺飞

编辑 / 沈洁

2020年,应届毕业的蒋倩成了一名算法工程师,因为工作的原因,蒋倩接触到了刚刚开源的昇思MindSpore。

和许多开发者一样,蒋倩对人工智能和开源社区充满了好奇心,一边在社区中学习深度学习的算法原理,一边和别人分享自己的算法模型和技术教程。用他自己的话来说:“就像是一个升级打怪的过程,一开始自己也是一知半解,后来参加集训营、在社群中和大家交流,目前已经贡献了多个算法模型。”

现在的蒋倩有了一个新身份,既是自己公司的“技术大牛”,也是昇思MindSpore社区认证的“布道师”。像蒋倩这样优秀的认证开发者,昇思MindSpore社区里已经有300多位,其中不少人属于小白到大神的进阶式提升,他们在社区中不断学习成长的过程,形象地勾勒了昇思MindSpore在过去两年中的价值和意义。

借助MindSpore TechDay的机会,我们不妨将目光聚集到开源的另一面,即一个开源社区和开发者们的成长历程。

01 产业导向的进化

在昇思MindSpore正式开源前,AI框架已经流行了一段时间,经历了Caffe、Theano代表的浅层框架,到TensorFlow、PyTorch代表的通用框架的过渡。可这些框架并不能很好地适应工业需求,要么为了性能牺牲了易用性,要么为了灵活调试而牺牲了性能,无法同时满足易开发、高效执行的要求。

相较于那些学术性质的框架,昇思MindSpore有着鲜明的产业导向。在华为的AI战略布局中, Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX以及AI应用使能ModelArts等共同构成了相对完善的昇腾AI基础软硬件平台,其中昇思MindSpore可以在云、边、端等不同环境下进行开发部署,瞄准的是科研创新和产业应用。

蒋倩就是因为项目落地的需求,尝试了海内外的多个AI框架后,最终和昇思MindSpore结下了不解之缘。所以不同于市面上的其他框架,昇思MindSpore的进化过程呈现出了两个典型特征:

一是立足于实际场景的落地应用。

昇思MindSpore在1.0版中就达到了生产商用的标准,开发者可以放心部署在实际的生产场景中;开源一周年时推出的面向入门级开发者的新工具 TinyMS,被不少开发者形容为“无痛上手极好用”;不久前更新的昇思MindSpore 1.6版本中,针对开发效率进行了进一步改进,控制流性能得到提升并支持副作用训练。

二是将大模型作为开发的新范式。

大模型是连接技术生态和商业生态的桥梁,也是科研创新走向产业应用的重要枢纽,昇思MindSpore相继支持了鹏程.盘古、紫东.太初等千亿级参数的大模型,目的正是使能大模型的训练开发,推动大模型在不同行业进行应用落地,进而串联起产业链上下游的开发者,打通AI的产业化路径。

基于这样的产业布局,昇思MindSpore的不少特性被开发者点赞,诸如自动并行、二阶优化、动静态图结合、全场景部署、全栈协同加速等等,同时也让昇思MindSpore在市场上迅速站稳了脚跟。截止到2021年底,昇思MindSpore已经支持300多个网络模型,涵盖CV、NLP、推荐等主流模型,服务了超过5000家企业,并在医疗、交通、金融、制造、能源等领域进行了商业化应用。

如果说两年前的昇思MindSpore还是一个新生的婴儿,目前已经步入到了风华正茂的青年时代,在飞速前进的时代步履下,正在扮演许多行业、许多企业、许多开发者奔向人工智能康庄大道的“同行者”。

02 与开发者共成长

开源社区和开发者的关系,就像是大海和河流。在谈及开源文化的时候,被提到最多的词汇就是贡献。但中国还是一个开源文化贫瘠的市场,“拿来主义”曾经是很多开发者对开源的理解,想要在国内迅速构建起有生命力的开源社区,势必要创造出一套适合中国市场现状的新秩序和新文化。

昇思MindSpore奉行的原则是“开发者第一”,打个比方:就是让开发者站在“巨人”的肩膀上成为“巨人”。于是昇思MindSpore社区意在营造一种共生的环境,和开发者一起进行创新创造,一起学习成长。

在多个开源社区中注册过账号的蒋倩,将昇思MindSpore社区看作是学习型社区,并盛赞社区所提供的“保姆式”服务:

“首先需要点赞的是昇思MindSpore的低门槛,里面的很多工具降低了我们学习AI的技术要求,比如TinyMS提供了WEB UI 项目容器化快速部署,不需要代码就能在web界面体验图像识别,上传待推理的图片即可返回模型推理结果,目前已经支持LeNet5 数字识别、CycleGan 风格迁移、目标检测等多种任务。”

“然后让人印象深刻的是社区的运营,可以在B站、公众号等渠道看一些技术内容,通过社群和其他开发者聊天,官方还举办了很多针对开发者的活动,我就参加过集训营和开源创新实践课,这些活动并未过多占用我的时间,却在短时间里学到了很多东西,有很大的成长和收获。”

除了蒋倩提到的技术创新和运营活动,“保姆式”服务的内涵还体现在面向社区开发者的认证体系。

早在2020年5月份,昇思MindSpore就发布了国内首个AI开源社区的认证开发者体系,2021年沉淀出了相对完善的“英雄进阶体系”,与后来诸多社区认证相比,昇思的开发者认证规模大、分层细(包括优秀开发者、资深开发者、布道师和资深布道师4大级8子类)、透明高(B站有大量答辩录屏),为开源开发者打通了一条极具AI特色的从0到1的成长路径。

昇思MindSpore的利他主义精神,换来的不仅仅是开发者的成长,也为自身在开源世界博得了一席之地:昇思MindSpore的总下载量超过140万次、拥有4000多位核心贡献者、2021年就发表了300多篇基于昇思MindSpore的AI论文……同时越来越多的开发者正在加入昇思MindSpore,用一砖一瓦砌出中国的开源文化,传播人工智能的技术火种。

03 诠释开源的力量

开源世界里流传着一句著名的格言:社区重于代码。对于这句话的含义,坊间有着不同角度的解释,华为计算开源业务总经理堵俊平也表达过自己的理解:“通过开源社区,开发者接触到新场景、新技术,并把这个技术使用经验反馈回社区,发生一些化学反应,产生创新的机会。”

为了践行这样的理念,昇思MindSpore建立了一整套运营和管理机制,涉及泛内容平台、开发者活动、开发者社群、社区治理、生态合作、基础设施等内容,试图打造一个有竞争力的开源社区,让AI更好地普惠大众。

昇思MindSpore社区比很多老牌社区年轻了许多,但这并不妨碍小孢子(昇思MindSpore开发者的昵称)们诠释开源的力量。

MSG Women In Tech沙龙是昇思MindSpore社区社群活动特色的一个缩影,通过为科技从业女性提供一个多元包容的讨论窗口,推动有关科技与开源多样性的有益讨论,而这些讨论并非空谈——它们在诸多女性开发者的努力下,真正落地成为了开源共享的方案。比如AI和加密艺术家宋婷在活动中接触到了昇思MindSpore,通过对世界保护非物质文化遗产——扎染的图案进行训练,能够基于GAN模型生成新的扎染图案,以一种数字化的方式让云南少数民族的传统文化在时光流逝中不被磨灭。

山水自然保护中心自2011年开始在野外开展红外相机调查与长期监测,积累了大量红外相机数据,但照片的处理、识别和分析却要靠肉眼进行。在和昇思MindSpore社区沟通后,达成了开展野外场景下红外相机照片 AI 物种识别模型训练的合作,红外相机拍摄的照片交给AI模型进行初步的识别和筛选,再由志愿者对识别结果进行检查和修正,极大地提升了照片的识别速度。

同样有说服力的,是“开源之夏”对一些开发者的专访,其中武汉大学的博士研究生谢晴兴在采访中表示:“兴趣很重要,只有热爱才能让自己一直坚持下去。根据自己的兴趣选择一个适合自己开源项目,然后持之以恒地做下去。”

或许这就是昇思MindSpore社区想要的结果,开源社区的重心或许从来都不是代码,而是激起开发者的热情和热爱,做一件让自己快乐、有意义、有价值的事。

目前昇思MindSpore社区已经是国内第一热度的AI开源社区,官网访问量超过6300万次,在码云开源项目中综合排名第一。这些数字远不足以概括开源社区的价值,很多开发者在昇思MindSpore社区找到了志同道合的人,找到了他们热爱的事情,然后用自己的擅长方式“改变世界”。

04 关于TechDay

如果你也想和昇思MindSpore一起成长,千万不要错过下面的重要信息:

3月26日和27日,昇思MindSpore社区将举办首届MindSporeTechDay活动,届时将有MindSpore1.6版本、TinyMS V0.3版本的重磅更新,以及一大批开发者现身讲述自己的成长故事和职场经验,还有李永乐、稚晖君等“大咖”登台互动,去年让人眼前一亮的AI开源吐槽大会也将迎来第二届……

这是一场关于“成长”的线性叙事,以上不过是故事的第一个章节。如果你也是一位有理想的开发者,或许可以选择和昇思MindSpore一起成长,书写属于你的故事和篇章,一同用脑力和体力点燃中国AI的星星之火。

希望看到您的想法,请您发表评论x