当前位置：首页 > 科技资讯 > 英伟达AI Foundry服务革新登场，企业定制模型新时代或将开启

英伟达AI Foundry服务革新登场，企业定制模型新时代或将开启

发布时间：2024-09-28 02:02:13 作者：电子资源网阅读：1次

近日，英伟达（Nvidia）低调发布了其创新AI服务平台——AI Foundry，这一举动预示着企业界或将迎来个性化AI模型定制的新浪潮。该服务平台致力于协助企业快速构建和部署量身定制的大规模语言模型，旨在以增强的精确度与更灵活的掌控力应对市场的瞬息万变。

AI Foundry结合了英伟达的硬件、软件工具和专业知识，帮助公司开发出针对具体业务需求的定制化开源模型，例如Meta刚刚发布的Llama3.1。随着企业越来越希望利用生成式AI技术，同时又希望掌控自己的数据和应用，AI Foundry的推出正逢其时。

英伟达表示，通过对这些开源模型的定制，能够显著提高模型的表现。例如，定制后的模型准确度能提高近10个百分点。AI Foundry不仅提供了大量预训练模型，还通过英伟达的DGX Cloud和NeMo工具包提供高性能计算资源和模型定制评估。此外，英伟达的AI专家团队还将提供专业指导。

除了AI Foundry，英伟达还推出了NIM（Nvidia Inference Microservices），这是一种将定制模型打包成容器化、API可访问格式的服务，简化了模型的部署过程。NIM标志着英伟达在AI模型部署方面的一项重大突破，展示了公司在多年研究和开发上的积累。

此次发布的时机也很微妙，正值Meta发布Llama3.1之际，同时也在AI安全性和治理问题日益引发关注的背景下。通过提供一个让企业能够创建和控制自己AI模型的服务，英伟达可能在满足企业对高级AI需求的同时，规避了使用公共通用模型的风险。

然而，定制AI模型的广泛部署也可能带来一些挑战，如AI能力在各行业间的碎片化以及保持一致的AI安全和伦理标准的困难。随着AI行业竞争的加剧，英伟达的AI Foundry将成为其在企业AI市场未来布局的重要一步。

8月5日消息，由于GDDR6X显存供应链吃紧，预计8月英伟达RTX 4070及以上型号显卡将面临供货紧缺的局面，相较于7月供货量或将有所下滑。对此，网络上出现了关于RTX 4070可能推出采用GDDR6显存版本以应对短缺的推测，这引起了硬件爱好者和消费者的广泛关注。

英伟达蓄力新献，RTX 4070显卡即将搭载GDDR6显存，GPU性能配置保持强劲

今日，英伟达爆料博主首次提到了这一新品，该显卡正在开发中，代号为 PG141 SKU 347（原版 RTX 4070 和 RTX 4070 Ti 也是 PG141，预计主板设计保持不变）。

爆料称，该显卡依然保持了 5888 个 CUDA 核心，显存速度从 GDDR6X 的 21 Gbps 略微降低至 20 Gbps，而带宽将从 504 GB/s 降至 480 GB/s，减少 24 GB/s。

至于新显卡的上市时间和价格，目前还没有关于这方面的可靠爆料。

9月5日消息，英伟达方面于今日早间针对近期传闻作出澄清。英伟达公司的发言人通过官方声明确认，截至目前，该公司并未收到来自美国司法部的任何传票。发言人在声明中强调，尽管如此，英伟达已主动与美国司法部进行沟通，并表明他们愿意配合回答相关部门可能对其业务提出的任何疑问。

英伟达发言人力驳传闻：未接获美司法部反垄断调查传票

周二报道称，美国司法部已经发出了与潜在反垄断调查有关的传票，这将标志着调查迎来升级。据悉，除了英伟达之外，传票还发给了其他公司。

两位“熟悉调查人员所提问题”的消息人士告诉路透社，美国司法部最近几周一直在向科技公司询问英伟达的商业行为，包括有关该公司硬件捆绑行为的问题。

消息人士称，除了捆绑销售的问题，司法部官员还在审查英伟达最近在 4 月份以 7 亿美元（当前约 49.84 亿元人民币）收购以色列 Run:AI 公司及其芯片业务的交易。据报道，官员们正在调查这次收购是否会进一步加强英伟达对人工智能计算市场的控制。

英伟达今年夏天曾短暂超过微软，成为全球最有价值的公司，但现在它落后于微软和苹果。在周二下午传票公布之前，该公司股价下跌超过 9%，一天之内市值缩水约 2790 亿美元（当前约 1.99 万亿元人民币）。

热门文章

应用排行游戏排行

热门合集