对话华为天才少年张霁:寻求大模型时代存储最优解
三年前,张霁从华中科技大学博士毕业,以“天才少年”计划身份加入华为,引起全网瞩目。人们惊叹其年纪轻轻就取得如此亮眼的成绩,也被其从普通三本到华科博士,再到突破一系列前沿科研成果的经历所振奋。
加入华为后,张霁扎根AI存储架构研究,发表多篇顶级论文与专利,并已在华为数据存储产品中落地。如今,大模型变得火爆,作为华为苏黎世研究所存储首席科学家,张霁带领他的团队站在AI浪潮的前沿,又一次成为新科技时代的弄潮儿。
近日,华为发布两款大模型时代的AI存储新产品,旨在为基础模型训练、行业模型训练、细分场景模型训练推理提供存储最优解,释放AI新动能。
“存储系统是关键基础设施,我们希望客户借此能够高效快捷地把AI大模型用起来,从而在不同行业里发挥价值。”张霁告诉新京报贝壳财经记者说。
大模型时代凸显四大挑战
今年1、2月,ChatGPT全球火爆,面对这一新智能时代的到来,身在国外的张霁思考的课题是,如何进一步优化数据存储,“存储系统作为IT基础设施,要面向各种各样的应用,包括高性能计算(HPC)、科学计算、人工智能等,我们希望提供更高效的存储,让上层应用的并发、带宽以及数据的读取能够更快。同时也希望我们的存储系统变得更加智能,更好地支撑一些AI应用。”
这种研发方向和十年前存储系统扮演的角色有所不同。张霁介绍称,以前大家对存储系统的理解只关心其能不能把数据存储好。但是现阶段和以后,还应更关注应用和数据的价值。
为了抢抓新科技时代机遇,上半年国内头部厂商纷纷投入建设大模型,行业内出现“百模大战”的势头。张霁也带领团队做了很多相关的事情,比如把大模型内部运转原理完全打开,一步一步去分析其生产过程当中与存储系统之间的交互。
在张霁看来,产业机会更多还是针对不同垂直领域的大模型,“因为无法直接用通用大模型去造福千行百业。”同时,行业内现在更多考虑大模型如何训练得更快,而如何保证数据安全以及降低中小企业使用门槛也成了亟待解决的问题。他还提到,当前大模型主要是单一数据方式即文本,长期来看,如何纳入更多包括图片、视频等在内的非结构化数据,让其真正变成一个“万物皆可做预测”的大模型,也是需要不断创新和研究的方向。
华为公司副总裁、数据存储产品线总裁周跃峰博士介绍称,以存力和算力为中心的大模型时代凸显四大挑战,包括数据归集慢,数据预处理周期长,训练集加载慢;训练易中断,数据恢复时间长,以及企业实施门槛高。