第6章
来。”
“会不会被他们学走?”
“会。但学得走架构,学不走思路。”
宋知行打了个哈欠。
“所以说白了,我们就是光脚的不怕穿鞋的?”
“对,但光脚的前提是跑得快。”
我在白板上写了一行字。
“答辩之前,我需要一个东西——一个能在十二块GPU上跑通的原型验证。不需要完美,只需要证明这条路走得通。”
“多长时间?”
“五天。”
全场安静了。
五天做一个AI认知架构的原型验证。
正常情况下这需要三个月。
宋知行第一个开口。
“行。但我需要一个条件。”
“说。”
“咖啡不限量。”
林锦书举手。
“我也有个条件。”
“说。”
“别让我写文档。”
“成交。”
那五天后来被魏东来称为“地狱周”。
五个人挤在八百平米的空楼里,每天只睡三四个小时。
宋知行写了一万两千行代码,打破了他自己的纪录。
林锦书把神经科学的注意力机制模型转化成了可计算的数学公式,这一步在学术界从来没人做过。
谢不渡把十二块GPU的性能压榨到了理论极限的百分之九十七。
魏东来负责统筹架构,协调每一层之间的数据流。
我呢?
我坐在白板前,一遍一遍推演架构的每一个节点,寻找可能崩溃的薄弱环节。
第三天凌晨,系统第一次跑通了。
然后崩了。
内存溢出。
宋知行爆了一句粗口,开始重写内存管理模块。
**天中午,第二次跑通。
跑了十七分钟,输出了第一组认知推理结果。
所有人围在屏幕前。
数据很粗糙,但方向是对的。
用十二块GPU,在认知推理任务上达到了钱穆白四千块GPU百分之六十三的水平。
“百分之
“会不会被他们学走?”
“会。但学得走架构,学不走思路。”
宋知行打了个哈欠。
“所以说白了,我们就是光脚的不怕穿鞋的?”
“对,但光脚的前提是跑得快。”
我在白板上写了一行字。
“答辩之前,我需要一个东西——一个能在十二块GPU上跑通的原型验证。不需要完美,只需要证明这条路走得通。”
“多长时间?”
“五天。”
全场安静了。
五天做一个AI认知架构的原型验证。
正常情况下这需要三个月。
宋知行第一个开口。
“行。但我需要一个条件。”
“说。”
“咖啡不限量。”
林锦书举手。
“我也有个条件。”
“说。”
“别让我写文档。”
“成交。”
那五天后来被魏东来称为“地狱周”。
五个人挤在八百平米的空楼里,每天只睡三四个小时。
宋知行写了一万两千行代码,打破了他自己的纪录。
林锦书把神经科学的注意力机制模型转化成了可计算的数学公式,这一步在学术界从来没人做过。
谢不渡把十二块GPU的性能压榨到了理论极限的百分之九十七。
魏东来负责统筹架构,协调每一层之间的数据流。
我呢?
我坐在白板前,一遍一遍推演架构的每一个节点,寻找可能崩溃的薄弱环节。
第三天凌晨,系统第一次跑通了。
然后崩了。
内存溢出。
宋知行爆了一句粗口,开始重写内存管理模块。
**天中午,第二次跑通。
跑了十七分钟,输出了第一组认知推理结果。
所有人围在屏幕前。
数据很粗糙,但方向是对的。
用十二块GPU,在认知推理任务上达到了钱穆白四千块GPU百分之六十三的水平。
“百分之
阅读下一章(解锁全文)
点击即可畅读完整版全部内容
相关书籍
友情链接