返回第一百二十四章 删除  路大头首页

关灯 护眼     字体:

上一章 目录 下一页

七点半,十三楼还没几个人。

赵文渊推开十三楼办公室的玻璃门,走廊的灯还是感应模式,一段一段地亮起来。他把背包放在工位上,打开笔记本,先去茶水间接了一杯冰水。

这是他的习惯。早到一个半小时,利用安静的时间看数据。

模型的训练面板排在浏览器第一个标签页,昨晚跑的第六轮微调结果已经出了。

他点开损失曲线。

基本是平的。

和前天一样,和大前天一样,和上周一样,后训练走到这一步,就像拧毛巾里的水,最后几滴也拧干了。

赵文渊关掉面板,喝了一口冰水。

手机亮了一下,是lked的通知。

他一般不看lked,上面十条消息九条是猎头群发的模板,“高薪内推”“期待交流”,复制粘贴都懒得改名字。但这条不一样,发件人的主题里带着“nexai”的名字。

赵文渊点开了。

站内信,来自nexai的人才招募总监,不是群发模板,第一句话就写了他在谷歌时的研究方向,第二句提到了天工模型在代码生成领域所取得的成就——昨天才刚刚在官网上公布。

信息大意是:nexai正在计划组建中国区研究团队,可能在海城或京城,看过他的背景,希望约时间聊聊。

赵文渊没有回复。

但他顺着信息里的链接点进了nexai的官网。

团队配置:四十多位研究员,核心成员来自openai、deepd、taaib。技术目标:最好的通用大模型。正在招的岗位——基座模型训练。

每一条都踩在他心里最痒的地方。

他当然不想跳槽,但他真羡慕那些资源。他手上十几个人,每天只能在后训练的天花板底下磨那点提升。

走廊那头响起了脚步声,赵文渊赶紧关掉页面。

九点差一刻,十三楼已经坐了一半人。

小牛端着咖啡拐过来:“赵哥,昨晚的消融实验跑完了,结果在共享盘里。”

“看过了。”赵文渊说。

小牛愣了一下:“你几点看的?”

“早晨。”

小牛张了张嘴,没吭声,转身回了工位。

旁边的小郭在调数据清洗脚本,扭头问他怎么处理多语言混合的token切分,赵文渊走过去看了一眼屏幕,指了指第三行:“这里换个模式,先跑一版看效果。”

小郭点头,开始改。

赵文渊站在工位过道中间,扫了一圈。

十三个人,大部分是他亲自面试挑的。小牛是他在交大时候的师弟,小郭是面试时唯一一个敢当面就跟他争论采样策略的。角落里两个新来的数据工程师对着屏幕标注,头都不抬。

八点五十三。

赵文渊合上笔记本,拿起手机,下楼。

敲门的时候,韩路一已经在了。

桌上有一杯没喝完的咖啡,笔记本开着但屏幕灭了。韩路一的眼神发亮。

“坐。”韩路一关上门。

赵文渊在办公桌对面坐下。

没有寒暄。

“我想做通用基础模型

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一章 目录 下一页