i740就是Intel推出的第一款产品,极大的推动了AGP标准的发展。性能比 Voodoo 1低,靠着Intel的地位和便宜的价格,一众厂商也很乐意推出有关i740的产品,一来二去Intel提高了在图形核心市场的占有率,后来,Intel将i740改进后集成在810芯片组(被称为i752)内,原本也有将i752独立生产为显卡的的想法,但后来并未正式生产。此后,Intel专注于整合显卡领域,再也没有推出过独立显卡,i740成了Intel独立显卡的绝唱。
扩展阅读
Intel740(常被简称为i740)是英特尔公司研发的显示核心。它是英特尔唯一一款被用于独立型显卡上的显示核心,于1998年2月正式发布。
Intel于1997年7月收购了 Chips and Technologies 公司。这间公司专注研发笔记本电脑的2D显示核心。通过收购这间公司,Intel得到了2D显示核心的技术。3D技术方面是在Real3D公司的协助下研发的。Real3D是洛克西德·马丁的子公司,而Intel持有该公司的20%股权,所以得以与REAL3D合作研发显示核心。
它支持AGP 2X,有8MB显示存储器。像素填充率是55Mpixels/s,支持DVD解压,亦支持3D加速,包括OpenGL。
i740是第一款采用HyperPipelined 3D架构的显示核心,亦是64bit架构。它采用0.35微米工艺制造,核心频率与AGP接口同步,即是默认值为66MHz。通过提高AGP接口的频率,就可以将核心超频。除了3D图形显示外,i740提供出色的2D显示和视频播放效果。
i740的另一个目的是推广AGP标准。i740是第一款AGP 2X显卡,i740的高销量使其他显示核心厂商接纳AGP标准。
泰鼎,“Trident”,是一家供应平面屏幕显示器(包括液晶显示器、等离子显示器、HDTV等等..)之视频处理器(Video Processor)芯片的公司,过去也曾是提供个人电脑显卡芯片与声卡芯片的厂商。 在2D图形芯片时代的行业巨头—在90年代初期,几乎在每台的IBM兼容机上都可以看到Trident8900和9000系列显示卡的身影。
泰鼎创立于1987年,那个PC刚刚进入彩色显示的时代,是货真价实的行业先驱。
当时在制造、销售廉价但性能普通的SVGA显示芯片上颇有声誉,许多OEM显卡制造厂商都采用泰鼎的芯片。
在个人电脑显卡市场从单纯页框缓冲显示(基本VGA彩色显示输出)移转至更高等的硬件加速显示(多重分辨率,SVGA输出,勿与3D硬件加速混淆)时,泰鼎继续延袭他们销售价格低廉与但性能普通显卡芯片的商业策略。
在1990年代中期,泰鼎在芯片性能短暂追上他的主要对手─S3 Graphics,推出了性能可与S3 Trio64V+媲拟的TGUI-9680芯片,但Trio64V+还是在True Color模式输出性能上胜过TGUI-9680。
虽然泰鼎享受了3DImage与Blade 3D产品线的一些成功,但自从英特尔大举侵入个人电脑底端绘图芯片市场后,泰鼎转而与主板系统芯片厂商威盛、扬智等合作,将绘图芯片集成于个人电脑系统芯片上,如ALi Cyber-ALADDiN、VIA PLE133等产品,但市场成功不大。
面对萎缩的市场占有率及攀升的研发经费(主要由于3D填图技术复杂性的增加),泰鼎在2003年6月宣布公司将于年底进行重大改组,将从前的显示绘图芯片部门完全售与图诚科技,从此转往平面显示视频处理器发展。
泰鼎于 2012年1月4日 宣布,泰鼎微系统公司已申请破产保护,并表示,已任命视频应用芯片制造商Entropic CommunicATIons Inc(ENTR)为非公开拍卖的买家 (stalking horse bid),意味着其他公司若想参与竞拍Trident资产,其出价必须高于Entropic。
Entropic将以5500万美元收购Trident的机顶盒业务、专利及其他知识产权,并将承担该公司的部分债务。
NVIDIA于1999年8月发布GeForce 256(核心代号NV10),是由NVIDIA研发的第五代显示核心。此核心常简称为GeForce,这亦是NVIDIA第一个以"GeForce"为名的显示核心。 NVIDIA在产品宣传中,称GeForce 256为世界上第一个GPU,这是NVIDIA首创的词汇,GPU即是Graphics Processing Unit的缩写。
GeForce 256与前代(RIVA TNT2)相比增加Pixel Shader流水线的数目,支持硬体T&L引擎,亦支持MPEG-2硬体影象加速。
GeForce 256显示核心采用0.22微米制程制造,是256-bit显示架构,拥有4条像素流水线。
每一条有4个像素单元,1个材质单元。三角形生成率是每秒1500万个,像素生成率则是每秒4亿8000万个。
它拥有2300万个晶体管,数量已超过了PentiumIII,本应采用0.18微米制程去解决热量问题,但为了加速上市,唯有采用旧的工艺。但凭着四条像素流水线,性能依然强劲。GeForce 256一般配置为32MBSDRAM(中高端)或DDR SDRAM(高端)。由于DDR带宽是SDRAM的两倍,所以能提供较佳性能,尤其在高分辨率的情况下。某些厂商曾推出64MB版本,但非常罕见。
GeForce 256凭着它的功能和速度,在各路厂商的竞争中获取很好销量,令NVIDIA的电脑图形工业霸主地位更坚固。
NVIDIA的成功,使3dfx,Matrox和S3 Graphics都变成牺牲品。就在GeForce 256发布后的几个月,竞争对手S3亦发布Savage 2000 Diamond Viper II。此产品内置硬体T&L,价格比GeForce 256便宜。但是,驱动带有缺陷,使T&L不能正常运作,而S3亦不打算对此修正。一年后,剩下ATi的Radeon显卡还能孤军作战。
NVIDIA提出GPU的概念
GPU(图形处理器)是NVIDIA就在发表NVIDIA GeForce 256(GeForce 256)绘图处理芯片时首先提出的概念,在此之前,电脑中处理影像输出的显示芯片,通常很少被视为是一个独立的运算单元。
而对手冶天科技(ATi)亦提出视觉处理器(Visual Processing Unit)概念。
图形处理器使显卡减少对中央处理器(cpu)的依赖,并分担部分原本是由中央处理器所担当的工作,尤其是在进行三维绘图运算时,功效更加明显。
图形处理器所采用的核心技术有硬件坐标转换与光源、立体环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等。
Instinct MI100 是其迄今为止性能最高的HPC GPU,FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次),并在架构设计上专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。
扩展阅读:
计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。
如今的一块卡,就相当于20年前的一个大规模计算集群!
AMD上代计算卡Instinct MI50采用的还是Vega 20核心,60个计算单元,3840个流处理器,32GB HBM2显存带宽1TB/s,Infinity Fabric总线带宽92GB/s,功耗300W。
Instinct MI100的核心规模翻了一番,显存带宽提升了超过20%,Infinity Fabric带宽提升了整整2倍,但是功耗却完全没变(工艺应当也还是7nm),新架构的能效可见一斑。
新卡的性能更是不可同日而语,FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。
在美国能源部旗下的橡树岭国家实验室,AMD MI100计算卡已经在支撑多项百亿亿次科研项目,涉及NAMD分子动力学模拟、CHOLLA星系形成研究、PIConGPU激光放射癌症疗法、GESTS流体动力学等等诸多前沿科技。
AMD Instinct MI100计算卡还有一个绝佳搭档,那就是AMD自家的霄龙数据中心处理器,慧与、戴尔、超威、技嘉等多家行业巨头都有提供这种双A方案。
当然了,只有硬件,是做不成高性能计算的,AMD同时一直在推进一站式软件解决方案ROCm。
从2016年初入江湖的1.x版本,2018年奠定基础的2.0版本,到2019年专注于机器学习的3.0版本,再到如今最新的4.0版本,AMD ROCm已经打造成了一整套针对机器学习、高性能计算的百亿亿次级开发方案,规划中的各项功能特性也基本都已经实现。
影音播放
43.65MB
摄影图像
22.20MB
实用工具
8.70MB
生活休闲
57.50MB
7.34MB
3.81MB
32.56MB
新闻阅读
7.47MB
11.76MB
战争策略
453.99MB
113.55MB
动作冒险
9.52MB
休闲益智
7.29MB
56.10MB
角色扮演
37.57MB
推理解谜
158.11MB
17.09MB
151.64MB
渝ICP备20008086号-14 违法和不良信息举报/未成年人举报:dzjswcom@163.com
CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved
英特尔i740——一款值得回忆的独立显卡发布
i740就是Intel推出的第一款产品,极大的推动了AGP标准的发展。性能比 Voodoo 1低,靠着Intel的地位和便宜的价格,一众厂商也很乐意推出有关i740的产品,一来二去Intel提高了在图形核心市场的占有率,后来,Intel将i740改进后集成在810芯片组(被称为i752)内,原本也有将i752独立生产为显卡的的想法,但后来并未正式生产。此后,Intel专注于整合显卡领域,再也没有推出过独立显卡,i740成了Intel独立显卡的绝唱。
扩展阅读
Intel740(常被简称为i740)是英特尔公司研发的显示核心。它是英特尔唯一一款被用于独立型显卡上的显示核心,于1998年2月正式发布。
Intel于1997年7月收购了 Chips and Technologies 公司。这间公司专注研发笔记本电脑的2D显示核心。通过收购这间公司,Intel得到了2D显示核心的技术。3D技术方面是在Real3D公司的协助下研发的。Real3D是洛克西德·马丁的子公司,而Intel持有该公司的20%股权,所以得以与REAL3D合作研发显示核心。
它支持AGP 2X,有8MB显示存储器。像素填充率是55Mpixels/s,支持DVD解压,亦支持3D加速,包括OpenGL。
i740是第一款采用HyperPipelined 3D架构的显示核心,亦是64bit架构。它采用0.35微米工艺制造,核心频率与AGP接口同步,即是默认值为66MHz。通过提高AGP接口的频率,就可以将核心超频。除了3D图形显示外,i740提供出色的2D显示和视频播放效果。
i740的另一个目的是推广AGP标准。i740是第一款AGP 2X显卡,i740的高销量使其他显示核心厂商接纳AGP标准。
Trident (泰鼎): The Pioneering Powerhouse in 2D Graphics
泰鼎,“Trident”,是一家供应平面屏幕显示器(包括液晶显示器、等离子显示器、HDTV等等..)之视频处理器(Video Processor)芯片的公司,过去也曾是提供个人电脑显卡芯片与声卡芯片的厂商。 在2D图形芯片时代的行业巨头—在90年代初期,几乎在每台的IBM兼容机上都可以看到Trident8900和9000系列显示卡的身影。
扩展阅读
泰鼎创立于1987年,那个PC刚刚进入彩色显示的时代,是货真价实的行业先驱。
当时在制造、销售廉价但性能普通的SVGA显示芯片上颇有声誉,许多OEM显卡制造厂商都采用泰鼎的芯片。
在个人电脑显卡市场从单纯页框缓冲显示(基本VGA彩色显示输出)移转至更高等的硬件加速显示(多重分辨率,SVGA输出,勿与3D硬件加速混淆)时,泰鼎继续延袭他们销售价格低廉与但性能普通显卡芯片的商业策略。
在1990年代中期,泰鼎在芯片性能短暂追上他的主要对手─S3 Graphics,推出了性能可与S3 Trio64V+媲拟的TGUI-9680芯片,但Trio64V+还是在True Color模式输出性能上胜过TGUI-9680。
于同时的笔记本电脑市场,泰鼎是最早使用嵌入型存储器与半导体制程技术,来封装结合绘图控制器与显示存储器于SoC单片机上的先驱,这个复合单片机方案解决了显示存储器颗粒占用笔记本电脑主板珍贵有限空间的问题。
虽然泰鼎享受了3DImage与Blade 3D产品线的一些成功,但自从英特尔大举侵入个人电脑底端绘图芯片市场后,泰鼎转而与主板系统芯片厂商威盛、扬智等合作,将绘图芯片集成于个人电脑系统芯片上,如ALi Cyber-ALADDiN、VIA PLE133等产品,但市场成功不大。
面对萎缩的市场占有率及攀升的研发经费(主要由于3D填图技术复杂性的增加),泰鼎在2003年6月宣布公司将于年底进行重大改组,将从前的显示绘图芯片部门完全售与图诚科技,从此转往平面显示视频处理器发展。
泰鼎于 2012年1月4日 宣布,泰鼎微系统公司已申请破产保护,并表示,已任命视频应用芯片制造商Entropic CommunicATIons Inc(ENTR)为非公开拍卖的买家 (stalking horse bid),意味着其他公司若想参与竞拍Trident资产,其出价必须高于Entropic。
Entropic将以5500万美元收购Trident的机顶盒业务、专利及其他知识产权,并将承担该公司的部分债务。
NVIDIA引领创新,GeForce 256开启GPU时代!
NVIDIA于1999年8月发布GeForce 256(核心代号NV10),是由NVIDIA研发的第五代显示核心。此核心常简称为GeForce,这亦是NVIDIA第一个以"GeForce"为名的显示核心。 NVIDIA在产品宣传中,称GeForce 256为世界上第一个GPU,这是NVIDIA首创的词汇,GPU即是Graphics Processing Unit的缩写。
扩展阅读
GeForce 256与前代(RIVA TNT2)相比增加Pixel Shader流水线的数目,支持硬体T&L引擎,亦支持MPEG-2硬体影象加速。
GeForce 256显示核心采用0.22微米制程制造,是256-bit显示架构,拥有4条像素流水线。
每一条有4个像素单元,1个材质单元。三角形生成率是每秒1500万个,像素生成率则是每秒4亿8000万个。
它拥有2300万个晶体管,数量已超过了PentiumIII,本应采用0.18微米制程去解决热量问题,但为了加速上市,唯有采用旧的工艺。但凭着四条像素流水线,性能依然强劲。GeForce 256一般配置为32MBSDRAM(中高端)或DDR SDRAM(高端)。由于DDR带宽是SDRAM的两倍,所以能提供较佳性能,尤其在高分辨率的情况下。某些厂商曾推出64MB版本,但非常罕见。
GeForce 256凭着它的功能和速度,在各路厂商的竞争中获取很好销量,令NVIDIA的电脑图形工业霸主地位更坚固。
NVIDIA的成功,使3dfx,Matrox和S3 Graphics都变成牺牲品。就在GeForce 256发布后的几个月,竞争对手S3亦发布Savage 2000 Diamond Viper II。此产品内置硬体T&L,价格比GeForce 256便宜。但是,驱动带有缺陷,使T&L不能正常运作,而S3亦不打算对此修正。一年后,剩下ATi的Radeon显卡还能孤军作战。
NVIDIA提出GPU的概念
GPU(图形处理器)是NVIDIA就在发表NVIDIA GeForce 256(GeForce 256)绘图处理芯片时首先提出的概念,在此之前,电脑中处理影像输出的显示芯片,通常很少被视为是一个独立的运算单元。
而对手冶天科技(ATi)亦提出视觉处理器(Visual Processing Unit)概念。
图形处理器使显卡减少对中央处理器(cpu)的依赖,并分担部分原本是由中央处理器所担当的工作,尤其是在进行三维绘图运算时,功效更加明显。
图形处理器所采用的核心技术有硬件坐标转换与光源、立体环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等。
AMD于2020年11月16日发布全新架构计算卡Instinct MI100,AI性能暴涨7倍
Instinct MI100 是其迄今为止性能最高的HPC GPU,FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次),并在架构设计上专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。
扩展阅读:
Instinct MI100 集成多达120个计算单元、7680个流处理器,搭配32GB HBM2,带宽高达1.23TB/s,同时支持PCIe 4.0,集成Infinity Fabric x16高速互联通道,峰值带宽达276GB/s(相当于PCIe 4.0 x16的大约4倍),而整卡功耗控制在300W。计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。
如今的一块卡,就相当于20年前的一个大规模计算集群!
AMD上代计算卡Instinct MI50采用的还是Vega 20核心,60个计算单元,3840个流处理器,32GB HBM2显存带宽1TB/s,Infinity Fabric总线带宽92GB/s,功耗300W。
Instinct MI100的核心规模翻了一番,显存带宽提升了超过20%,Infinity Fabric带宽提升了整整2倍,但是功耗却完全没变(工艺应当也还是7nm),新架构的能效可见一斑。
新卡的性能更是不可同日而语,FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。
在美国能源部旗下的橡树岭国家实验室,AMD MI100计算卡已经在支撑多项百亿亿次科研项目,涉及NAMD分子动力学模拟、CHOLLA星系形成研究、PIConGPU激光放射癌症疗法、GESTS流体动力学等等诸多前沿科技。
AMD Instinct MI100计算卡还有一个绝佳搭档,那就是AMD自家的霄龙数据中心处理器,慧与、戴尔、超威、技嘉等多家行业巨头都有提供这种双A方案。
当然了,只有硬件,是做不成高性能计算的,AMD同时一直在推进一站式软件解决方案ROCm。
从2016年初入江湖的1.x版本,2018年奠定基础的2.0版本,到2019年专注于机器学习的3.0版本,再到如今最新的4.0版本,AMD ROCm已经打造成了一整套针对机器学习、高性能计算的百亿亿次级开发方案,规划中的各项功能特性也基本都已经实现。
软件优化的力量无疑是巨大的,可以充分释放硬件潜力,比如说上代MI50,搭配ROCm 3.0的话性能相比于搭配ROCm 2.0可以提升3-4倍,而最新的MI100、ROCm 4.0联合,更是可以轻松带来5-8倍的性能提升。AMD ROCm生态的进步速度非常快,已经有众多领域的头部厂商采纳和支持,而且它沿袭了AMD一贯的原则,那就是完全开源开放,非常方便代码迁移,比如说HACC(宇宙学)只用了一个下午,SPECFEM3D(地震学)半天就搞定,CHOLLA(天体物理学)花了几天,QUDA(量子物理学)也不过21天。
影音播放
43.65MB
摄影图像
22.20MB
实用工具
8.70MB
生活休闲
57.50MB
实用工具
7.34MB
实用工具
3.81MB
生活休闲
32.56MB
新闻阅读
7.47MB
实用工具
11.76MB
战争策略
453.99MB
战争策略
113.55MB
动作冒险
9.52MB
休闲益智
7.29MB
动作冒险
56.10MB
角色扮演
37.57MB
推理解谜
158.11MB
休闲益智
17.09MB
角色扮演
151.64MB