2月21日消息 ,华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码 ,在CUDA和最终机器码之间起到桥梁作用 。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言 ,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型 ,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限 ,针对国产算力的优化或将有持续进展,值得重视 。
华泰证券:消费倾向有望上行,优选四大投资主线|界面新闻 · 快讯
中信证券:政务系统加速接入DeepSeek 2G信息化迎来新机遇|界面新闻 · 快讯
银河证券:“大流量入口+先进模型”的模式加速AI渗透|界面新闻 · 快讯
中信建投证券:电解铝强调清洁能源代替,绿证市场有望加速成长|界面新闻 · 快讯
华泰证券:宠物板块一季度业绩有望延续高增|界面新闻 · 快讯
IBM在watsonx.ai上线DeepSeek R1 蒸馏模型|界面新闻 · 快讯
车企密集接入DeepSeek,行业智能化有望提速|界面新闻 · 快讯
中信证券:建议关注订单拐点有望带来业绩弹性的户外代工行业|界面新闻 · 快讯
还没有评论,来说两句吧...