芯片研发部内,萧易和康博士继续深入沟通着接下来 AI方面的 GPU芯片规划。
“康博士,我们后续的规划要尽可能地提高算力,我还有一个想法,我认为后续我们算力中心可以采用 GPU芯片叠加的方法进行训练,以此提高人工智能模型的训练和推理速度。”
“就好比干活,一个人的计算能力是有限的,一个人算不过来,那就多找些人一起干,比如一千人或者一万个人一起计算,我们 GPU芯片叠加的方式与之类似。”
“比如我们可以使用一千张、一万张,甚至 10万张 GPU芯片进行叠加组合,组成一个超高性能计算系统,这样就能实现更大的算力,也能提升训练和运算速度,我把这个叫做 GPU芯片集群系统,你觉得如何?”
听到萧易关于千卡集群乃至万卡集群的想法后,康博士脸上直接露出了惊讶的神情。
“萧总,你这个想法目前我还不清楚能不能实现,需要进行一定的研发和测试,如果能实现的话,无疑可以极大地提高我们现在的算力和运行速度。”
“嗯,我明白,实现这个过程可能会很难,估计还有很多技术难点,但既然我们打算做这件事,这些迟早都要面对的。”
“是的,我大致估算了一下,实现集群运算,可能需要构建一种全新的架构,搭建出一套属于我们自己的硬件生态标准,还需要不一样的算法模型,另外,液冷技术也需要进行研发,不然会出现计算或者散热跟不上的情况,这可能需要投入非常多的人力和研发资金。”
“放心吧,康博士,我还是那个承诺,你尽管放开手脚去干,人员安排我会跟人事部沟通,确保你们芯片研发部门作为第一优先级,待遇方面也会提高,研发资金更不用担心,50亿不够就 100亿,100亿不够就 200亿,我就不相信咱们国家地大物博,这点困难啃不下来。”
“明白了,萧总,您放心,我一定尽力去做。”
“嗯,不要给自己那么大压力,我们的优势还是很大的,你看,我们的用途明确,目标也很明确,现在缺的只是如何落地,而且我们也不需要做到行业领先。”