如何打造一个拖垮公司的大模型?
第一步:先砸十个亿买卡
做大模型,要有大格局,舍不得孩子套不着狼。
什么X100、Y100……专挑算力强的买。
正规渠道没货了?不能怂!加价也要整起来。
第二步:从顶流公司挖大牛来坐镇首席科学家
必须是业界扛把子级别的大牛,就职于顶流AI公司比如“CloseAI”,经常在各种会议上高光出镜的那种。
能把整个团队都带过来最好,成建制、好管理、出活儿快。
第三步:定战略,当卷王
模型参数至少要万亿级别,当不成卷王,就只能被卷死。
再来个“智算中心”,算力至少达要1000PFLOPS,自己训练完大模型,还能把算力开放出来给同行。
第四步:万事开头难,从数据准备开始全员鸡血加班
数据不够怎么整?公开一部分,自有一部分,交易一部分。
拿到数据后,得清洗处理,全体动员做标注,老板亲自下场,主打一个陪伴。
第五步:开始玩命训练,不出意外的话快出意外了
服务器挂了、存储速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……
什么?!Checkpoints没保存?反复回退,反复调参,反复排雷。
第六步:内部开始自我修正
问题一多,团队就乱了,人都变得很浮躁。
公司原有的主营业务停滞不前,业绩下滑。
第七步:不管产品行不行,市场宣传要先行一步
“我们来了!”广告要全渠道、全媒体覆盖。
必须要业界感知到我们来势汹汹的霸气。
第八步:生态伙伴少不了,气氛必须搞起来
先结盟5000家合作伙伴,达成意向合作。
第二天,大家联合发发新闻稿,必须让吃瓜群众充满期待。
第九步:大模型终于“练”出来了
练是练出来了,看上去有点不对劲,莫不是个“大傻子”吧?
落地实施,那叫一个难,不知道给谁用,不知道往哪儿用。
第十步:及时止损,人间清醒
然后开始复盘,多么痛的领悟~
大牛来了又走了,算力卡买了又卖了,智算中心建了又拆了,大模型炼了又废了。
附赠:
@东书房张效奎:OpenAi开发sora的一些内幕,据我朋友透露:
Sora的研发之所以这么神速,是因为商务部雷蒙德开了一个人工智能专题推进会,发布了一个《美国ai赋能产业焕新》草案,拜登签了字的。这个草案要求,各美国公司要加大推进人工智能的发展,深入推进、加快布局、大力发展智能产业。草案还要求各公司成立ai赋能专项工作小组,设立组长一人,副组长10人,调研员50人,程序员2人,开展ai专项行动。
雷蒙德强调:发展ai的关键问题,就是要把发展ai的问题解决好,以此来解决ai发展的问题。
我朋友悄悄跟我说,OpenAi连夜召开会议,学习了雷蒙德部长的会议文件,并向公司的每一个员工传达了会议精神。Openai的首席官米拉穆·拉迪强调,公司将要夯实发展基础底座,把主要资源投入到AI专项工作小组,努力提高组长、副组长、调研员的福利领域。加快写出一些具有先进性、开创性的《ai研发调研报告》。
最后我朋友抽了口烟,忧心忡忡地说,美帝的OPENAI的研发核心太强,咱们怕是不好超越了。我就问他核心差距在哪?他吐了一口烟圈告诉我:他们的民主党、共和党都在公司设立了党支部,总共有两个!