国产GPU的第一缕光:自研架构“天狼星”在京亮相
华夏时报(www.chinatimes.net.cn)记者 柳川 陈锋 北京报道
不久前,对于美国对中国芯片业的打压,英伟达首席执行官黄仁勋接受媒体采访时说:“无法向美国采购GPU芯片,将促使中国自行研发设计制造。”
(资料图片)
黄仁勋的话很快就得到应验。6月15日,国产自主GPU架构“天狼星”鉴定及发布会在北京举办。据悉,中天恒星研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA合作教授邓仰东博士率领。此次发布的“天狼星”主要有三个技术优势:突出性价比优势、拥有完全自主知识产权、完备的交付能力。
中天恒星联合创始人、总架构师邓仰东博士对《华夏时报》记者表示:“很多国产的GPU的IP授权主要购买自第三方,中天恒星的路线有所不同,核心的图形引擎是完全自主设计的,所以3D图形引擎这块不涉及到别人的知识产权,也没有IP的问题,全部是我们自己拥有,从0到完整架构的实现都是我们自主的技术。”
国产自主GPU架构“天狼星”出世
GPU(Graphic Processing Unit)即图形处理器,是数字世界图形内容生成的基石,不管是桌面应用、游戏、电影、数字孪生还是元宇宙;与此同时,强大的并行计算能力业已成为各种应用加速的主流手段,正广泛应用于科学计算和人工智能。然而,我国GPU芯片基本全部依赖进口。随着美国不断加码限制英伟达、AMD向我国供应高端GPU芯片,我国进口GPU也受到极大的限制。
6月15日,国产自主GPU架构“天狼星”鉴定及发布会在北京举办。“天狼星”由国内企业中天恒星科技有限公司(Advanced Technology Stellar,简称中天恒星/ATS)自主研发。
中天恒星研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA合作教授邓仰东博士率领。
资料显示,邓博士是GPU通用计算最早研究人员之一,被誉为“GPU通用计算先行者”。邓长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作;曾设计出全球第一个基于FPGA的GPU仿真平台;研究成果在ISCA、MICRO、等顶级会议和期刊发表。
据悉,“天狼星”GPU架构有七大亮点:一是具有3D图形引擎+2D图形加速+视频引擎。二是自主可控/灵活优化的指令集和VLIW/SIMD机器指令集(ICCD’13);其中,自主可控/灵活优化的指令集,保证GPU芯片迭代的软件兼容。三是SIMT计算框架,充分利用图形应用的数据并行性。四是支持物理真实渲染。五是,包括SIMT独立指令执行单元、以32位浮点ALU为基础的统一图形架构以及集成寄存器堆、纹理/数据缓存。六是延迟聚集式全局线程调度技术。七是具有良好性能伸缩性的片上互联架构。
此次发布的“天狼星”主要有三个技术优势:第一、面向亿级订单市场,以独立显卡GPU芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势;第二、拥有完全自主知识产权,以清华大学超过10年研究基础为依托的自研核心架构,确保产品迭代自主可控。以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计。核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于ISCA、Micro、IEEE TPDS、IEEE TCAD等顶级会议和期刊;第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证等。
对于“天狼星”架构,上海市集成电路行业协会秘书长郭奕武向《华夏时报》记者分析:“中天恒星自研架构,有这几个特点:一是3D图形渲染。二是指令集的自主可控,这是非常不容易的。三是它的框架结构,包括在整个储存器当中的DDR4实现高速存储,这个设计也是比较领先的架构,中天恒星都用上了。”
他进一步表示:“这决定了未来的产品用途非常广泛。中天恒星的切入点在显示领域,我觉得显示领域非常广阔,我相信在黄总的带领下,中天恒星一定会从架构到产品,最后能够使我们的产品在全球落地。”
逐步量产
目前,全球GPU市场主要由英伟达、英特尔和AMD三家巨头垄断,去年四季度独立GPU份额分别为85%、6%、9%。其中,人工智能、云端计算和独立GPU主要为英伟达主导,A100和H100最高浮点算力分别实现19.5 TFLOPS 和67 TFLOPS。
相较于此,中国国产GPU尚处萌芽期,与国际厂商差距更大。但随着高端GPU的出口限令,针对中国市场推出的特供版A800也已涨10万元的高价,国内GPU市场需求紧迫。
在此情形下国产化迫在眉睫,国产GPU厂商近几年也不断涌现,目前国内自研GPU的领军企业主要是寒武纪、景嘉微、华为昇腾等。
事实上,自研GPU架构存在极高的技术挑战。
邓仰东分析指出:“GPU设计有几个地方非常复杂:一个是架构级的设计,这其实是个统筹的艺术。GPU本身的资源,难的是如何配合起来实现整体性能最优。换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少30帧,这是一个极具挑战的地方。二是,架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这方面也是一个很大的挑战,需要有多年的积累才能去做这件事。”
2019年,第一代“天狼星”架构芯片设计验证完成;2021年,第一代“天狼星”架构GPU诞生;2022年,定义第二代GPU架构“大角星”;2023年,第一代“天狼星”架构GPU实现量产。
GPU架构取名为“天狼星”有着独特的寓意,中天恒星创始人黄永博士指出:“我们的架构全部是以恒星来命名的。Stellar是恒星、星宿、星座的意思,引申出来有超一流、卓越的含义。第二代架构命名为大角星;大角星是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的110倍。”
据悉,2024年,中天恒星会继续优化基于“天狼星”架构的GPU。2025年,将量产第二代GPU架构“大角星”。
国际信息显示学会北京分会理事长严群博士则向《华夏时报》记者表示:“我觉得现在真是一个很好的时机,要抓住它,潮流也在往这个方向走,机会非常多。我们如果能够逐步上去的话,我们不见得会比现在西方的有些国家的东西落后,因为你抓的点是更高层级的点。”
郭奕武认为:“现在正好是非常好的关口,即产业革命和新技术革命的兴起,大家也看到包括云计算、数字化、智能汽车、云端到边缘等等,这些产业化以后,都需要大算力,也就是我们所说的GPU。所以我们赶上的时机非常好,未来随着新的技术产业革命的发展,这个方面的空间是非常大的。”
责任编辑:
标签:
仓储物流“成渝圈”如何乘势而上? 12月3日,连接昆明和万象的中老铁路全线开通运营,被惠及的显...
两件西周青铜簋时隔三千年成功配对 考古工作者介绍,这个铜簋的盖、身分别时隔40余年出土,纹饰...
“医保砍价”不是一个人在战斗 晁星 “我眼泪都快掉下来了”“每一个小群体都不该被放弃”…...
“购物成瘾”真的是一种病 刘艳 牛雅娟 本周日即将迎来“双十二”促销季,很多人又开始摩拳...
因迷恋山间风景,一男子在甘孜州稻城县海拔4000多米的无人区迷失方向,随后与同伴失联。12月的稻城...
嫌疑人DNA信息比中后,成都市公安局刑侦支队技术处DNA实验室民警白小刚一下坐在凳子上,恍惚迟疑间...
一批反映南京大屠杀历史的新书发布 新华社南京12月7日电(记者邱冰清、蒋芳)“以史为鉴,开创未来...
我在现场·照片背后的故事|电影《亲爱的》里面没有的结局,在我眼前“上映” 12月6日,在深圳市...
冥想?泡脚?不如听听助眠音乐 晚上睡不着,白天睡不醒,成为最贴合都市人群的“睡眠画像”。随...
养老话题 老年教育面临缺口 “终身教育”潜力无限 【现实挑战】“新老年”群体愿意在培养兴...
孙海洋被拐14年儿子如何找到的? 警方侦办另一宗拐骗儿童案时发现线索,通过人像比对、DNA确认找...
北京天文馆、圆明园将对未成年人免费开放 12月6日,北京天文馆发布通知称,12月8日起试行对未成...
今年全国粮食总产量再创新高 连续7年保持在1 3万亿斤以上 根据对全国31个省(区、市)的抽样调...
斑块软的很危险 硬的就无碍? 血管里的“垃圾”分类 赶快学起来! 一项最新研究显示:中国...
诺西那生钠注射液大幅降价 聚焦医保谈判背后脊髓性肌萎缩症家庭 医保目录公布那天 好多家长都...
抖音“窗花剪剪”遭抄袭 被判获赔20万元 法院认为“窗花剪剪”的这种表达方式理应受到《著作权...
公安机关近日侦破3起拐卖儿童案件 失散十几年 3组家庭终于团圆了 北京青年报记者12月6日从公...
2021年度十大网络用语发布 本报讯(记者 路艳霞)作为年度“汉语盘点”活动最具网络特色的组成部...
北京天文馆向未成年人免费开放 本报讯(记者 牛伟坤)北京天文馆对票价免费及优惠政策作出调整:1...
2021北京百个网红打卡地发布 本报讯(记者 李洋)2021北京网红打卡地推荐榜单昨晚正式发布。自然...