首页 家电百科 实时讯息 常识
您的位置: 首页 > 实时讯息 >

恰同学少年 代码绘星河

0次浏览     发布时间:2025-05-22 07:22:00    

恰同学少年 代码绘星河

——国内首个基于国产算力预训练的视觉基座大模型“橘洲”V1端侧版本诞生记

长沙晚报全媒体记者 陈星源 刘丹

5月21日上午10时,当晨光穿透叶片,湘江之畔的创新史册翻开了新的一页——国内首个基于国产算力预训练的视觉基座大模型“橘洲”V1端侧版本正式上线。这个仅有0.4B参数量的“轻骑兵”,取得了2.5秒生成一张256×256分辨率图像的成绩,让文生图与千行百业的链接成为可能。

“橘洲”大模型出自哪里?湖南汇视威智能科技有限公司(以下简称“汇视威”)格外瞩目。汇视威里这群平均年龄不满30岁的“算力追光者”,花近半年的时间甘坐“冷板凳”,用一场分秒必争的科技攻坚,书写国产AI从“可用”到“可轻”的突破密码。将时间指针拨回24小时前,记者与汇视威团队并肩作战,共同见证这个大模型诞生前夕的关键时刻。

早晨

智谷微光,键盘上的代码青春

早上9时的世界计算·长沙智谷略显宁静,21岁的李诗佳穿过林语路,从公司公寓步行10分钟到达办公室,工位上的咖啡热气未散,她已专注敲起代码,与团队冲刺“橘洲”大模型V1版本的上线。

李诗佳与汇视威的缘分始于一场“双向奔赴”。2024年9月保研成功后,李诗佳进入导师的课题组线上“练兵”,凭借处理海量数据的细致与高效,被同课题组的汇视威创始人顾善植看中。今年2月,她以见习算法工程师身份加入汇视威。

“我的工作其实主要是两个部分,数据预处理和模型转换。”只见她的工位左侧屏幕滚动着海量图像数据,右侧显示着PC端向手机端转换的一些代码。

“我现在已经自主处理超2000万张图像数据,剔除重复、模糊、图文不匹配的‘杂质’,让大模型的‘食粮’更精纯。”李诗佳说,在模型转换环节,她需要将训练好的PC端模型“瘦身”轻量化,转换成手机端适配格式。“就像把厚字典压缩成口袋书,既要体积小,还得知识不丢分毫。”

这款完全基于国产算力训练的大模型,从框架适配到算法调优,每一步都是在“无人区”探索。而作为团队最年轻的成员,她的成长轨迹与“橘洲”大模型的进化同频共振。“第一次看到国产算力集群跑起自己的代码,本科时处理的数据量级和现在完全不在一个维度,这种实战经验于我而言实在难能可贵。”谈及即将发布的“橘洲”大模型,李诗佳眼里闪着光。

午后

撸猫棒与台球桌,片刻悠然

正值中午12时,在汇视威的茶水间,最显眼的不是咖啡机,而是两个猫抓板——“芝麻团”和“虎妞”常趴在上面看工程师们调试代码。这两只美短猫是2023年顾善植带来的,他说希望它们能在工作之余,为大家提供情绪上的安慰。

这种“撸猫+敲代码”的工作节奏曾是江西小伙彭英麒的日常,但和李诗佳相比,这几天他终于可以稍稍松口气了——数据前期的归纳、整理、储存基本已经结束,这不,刚在附近的湘菜馆饱餐一顿,他又来到茶水间给虎妞喂饭。

“数据供应链跑完了,终于有空当猫保姆了!”彭英麒边逗猫咪边惬意地说。

“机缘巧合”,作为一名见习数据工程师,彭英麒这样形容自己与汇视威的初遇。“记得在大学的计算机视觉课上,我的课设就是与文生图有关,于是自己主动联系、申请,今年1月份参与到顾师兄的“橘洲”大模型的研发。”

“就像给食材分类装盒,既要新鲜又要拿取方便。”彭英麒说,他主要负责大模型数据的归纳、整理、存储,需要将公开数据集与自产数据统一打包,整理成方便调用的格式。“这是比较关键的一步,因为后续进行大模型训练时,必须以最快的速度来读取这些图片,这样才能节省时间。”

最考验耐力的是数据集初筛阶段。连续好几周,他像个“数据质检员”般盯着屏幕,对数十个公开数据集进行“望闻问切”。彭英麒展示了最耗时的环节——连续两周人工筛查上百个公开数据集,给每个图像集打上“清晰度”“标注完整度”“场景多样性”的评分标签。“那段时间抬头看天花板都是浮动的图片小方块。”彭英麒笑着说。

“专业但又不失风趣。”在彭英麒眼里,汇视威是个“反刻板印象”的存在。团队成员学历背景都是博士、硕士,却没人端着“学术架子”。午休时的台球局是常态,周末的聚餐更像老友聚会,从东瓜山的烤牛油聊到模型训练的趣事,松弛感拉满。

彭英麒曾有过一段“提问焦虑期”。初入团队时,他总习惯把问题藏在心里:“怕被说水平不够,也怕打扰同事,宁愿自己工作到凌晨。”直到某次绕了三天弯路被团队的王聪睿博士发现,“下次犯错记得叫上我观摩”,一句玩笑话化解了彭英麒的“社恐”。王博士手把手教他逐帧分析数据流,工作效率肉眼可见提升,团队融洽的氛围让彭英麒原本的紧张感舒缓了不少。

“顾总更是一个非典型CEO。”彭英麒说,印象中,理科生应该是理性思维偏多,但顾总却是感性的,能照顾到每一个员工的情绪。批评人也从不摆架子,总会给个台阶下。“他还像带着我们打副本的老玩家,在前面冲锋陷阵。在他的带动下,我也获得了参与多个高精尖项目的宝贵机会,在实战中不断成长。”

傍晚

披星戴月,打通落地“最后一公里”

夜色降临,汇视威的办公间逐渐沉寂,只有“咔哒咔哒”的键盘敲击声回响。王聪睿从工位上直起身,揉了揉泛红的眼角,端起微凉的咖啡抿了一口。自从大模型研发进入冲刺期,这位“95后”CTO(首席技术官)每天都要奋战到凌晨三四时。

王聪睿正在攻克的是大模型落地的“最后一公里”:让算法脱离云端算力,用户无需联网也能调用大模型的功能。“我们的大模型是在国产GPU上面部署、训练的,之前从没有人这样做过,我们算是第一批‘吃螃蟹的人’!”工作量大、充满不确定性,他坦言,每天睁开眼都是“新的战场”。

“调试—创新—再调试”,为了最完美的部署迁移方案,王聪睿一头扎进工作里,披星戴月近半个月终于拿下。部署成功的前一个晚上令他格外难忘,“虽然还没有成功,但已经有了70%以上的把握!”王聪睿兴奋地告诉记者,在不断的调试中,他找到了适配国产硬件的部署方案,现在大模型已经可以在手机上正常运行。

将时间指针拨回4年前,任职于某互联网大厂的王聪睿,在晋升前夕接到研究生室友顾善植的来电,毅然辞去工作奔赴AI赛道。从打工仔到创业者,促使他迈出这一步的是信任与坚持,“当时很激动,想着能够和以前的同学一起创业,有了目标之后就一直锲而不舍地努力。”

见证了大模型从0到1的成长过程,如今即将开花结果,王聪睿心中倍感欣慰,“它就像我的孩子一样,现在也期待怎么向观众发布。”说罢,他放下手中的空咖啡杯,清脆的键盘声再度填满办公空间。

凌晨

天将破晓,橘洲之畔看旭日初升

凌晨3时,加班的伙伴陆陆续续离开公司,顾善植微笑着向他们挥手。关掉最后一盏灯,他乘电梯下楼,迎面与清爽的夏风撞了个满怀。

“等风来,不如追风去!”顾善植临时调转方向,驱车朝着湘江边驶去。“很亢奋。”他如此形容最近的工作状态,“不只是我,大家一起熬了这半年,都希望进行第一次的整体亮相!”

顾善植所追的,不止这一缕清风,更是百年难得的行业机遇。

汇视威这家初创公司刚迈入第4个年头,却在去年经历了一次深刻的赛道更迭,“我们之前3年多全部是在做To B端,订单、产品已相对成熟,后续不需要过多的研发投入。”作为公司创始人,顾善植开始寻找下一个可关注的领域,文生图大模型进入了他的视野。虽然彼时业内不太看好这一赛道,玩家也寥寥,但顾善植选择逆流而上,“一方面是勇气,另一方面是底气。”

勇气来自于团队拥有一群平均年龄不到30岁的年轻人;底气,是团队成员大多是来自国内名校的博导、博士、硕士,再加上在头部大厂、实验室经验累积的满满自信。

除此之外,还有那么一点可遇而不可求的运气。

“第4年的时候能够遇上这样一个风口和契机,这是我们没法预料的!”在顾善植看来,公司去年年底决定向大模型进军,今年初便迎来AI应用的浪潮,再次提升了整个行业的关注度,也为其产品推广营造了良好氛围。

当大势如湘江潮水般涌上来,是被浪花吞噬还是御浪而行?稳扎稳打的汇视威给出了答案——17名成员组成的核心小组,合作单位中科曙光接近1:1的人员支持,从一周一次到两天一次甚至一天一次的例会讨论……随着7个创新点逐一攻破,团队的信心与日俱增。

“我们还在攻关图片生成效果,希望质量更高,速度更快!”顾善植告诉记者,256×256分辨率的图片,他的预期是0.5秒出图,512×512分辨率的图片也要控制到1秒以内。

看万山红遍,层林尽染,漫江碧透,百舸争流——每当想起橘子洲,顾善植脑海中总浮现这样一幅立体而动态的画面,“我觉得这其实很符合我们大模型的效果。”在一次团队的深夜谈心后,大家很有默契地为大模型定下了“橘洲”这个名字。

这支“95后”长沙团队,用“橘洲”大模型在文生图赛道划出一道耀眼的“湘”字轨迹。作为国内首个基于国产算力预训练的视觉基座大模型,它的诞生不仅是企业技术实力的印证,更在全球人工智能版图上标注了属于中国科技的鲜明坐标——这既是对“人工智能竞逐全球”浪潮的有力回应,也为行业掀开了“下一个半场”的新序章。

天将破晓,橘子洲大桥在晨光中绷成金色琴弦。顾善植这位“长沙市大学生创新创业之星”,看着一轮红日冉冉升起,东方的云层正在裂变。远处,橘洲轮廓浮在粼粼波光之上,宛如正在渲染的图层,等待朝阳为它加冕。

相关文章
山东1地新添两位副区长后,区政府领导分工调整
2025-05-22 09:29:00
恰同学少年 代码绘星河
2025-05-22 07:22:00
对话声通科技董秘刘艺涵:AI的真正价值不是堆砌参数,而是解决问题
2025-05-21 15:36:00
光大银行上线大模型授信调查智能报告功能
2025-05-20 16:30:00
安徽泗县市场监管局免费为出租车计价器“全面体检”
2025-05-20 12:38:00