工信部启动AGI等4大未来产业揭榜挂帅;G20峰会讨论建立AI治理框架;苹果发布新手机,芯片仅3nm|一周热点第16期

发布日期:2023-10-08 09:12

本周热点
1、G20峰会讨论建立以人为中心的AI治理框架
2、工信部启动AGI等4大未来产业揭榜挂帅
3、美国国会AI论坛落幕,监管AI或达成共识
4、研究者使用大语言模型解决P vs. NP问题
5、英伟达推出新应用,在H100 GPU上增强大语言模型推理能力
6、苹果发布新手机,芯片仅3nm

大家好,欢迎来到我们的人工智能一周热点推文!在这里,我们将为您呈现最前沿、最热门的人工智能资讯,涵盖了机器学习、深度学习、自然语言处理等多个领域。我们的目标是让您能够及时了解人工智能领域的最新动态,掌握行业发展趋势,为自己的职业发展和科技创新提供有益的参考。欢迎点赞关注与分享,让我们携手共进,探索人工智能的无限可能!

01
人工智能行业动态

1、G20峰会讨论建立以人为中心的AI治理框架
G20新德里峰会上探讨建立“以人为中心”的人工智能治理框架,并考虑全球监督。G20领导人在最终公报中表示,他们将努力确保“负责任的人工智能开发、部署和使用”,这将保护权利、透明度、隐私和数据保护,并避免其他问题,同意采取“有利于创新的监管/治理方法”,最大限度地发挥人工智能的优势,但同时考虑到与之相关的风险。

2、工信部启动AGI等4大未来产业揭榜挂帅
9月13日,工信部印发关于组织开展2023年未来产业创新任务揭榜挂帅工作的通知,面向元宇宙、人形机器人、脑机接口、通用人工智能4个重点方向提出工作要求。其中,面向通用人工智能提出智能芯片、智能算力集群、高质量数据集、人工智能风险管控软件4个核心基础,聚焦语言、语音、视觉、多模态大模型产品,加速面向工业制造、民生服务、科学研究信息安全领域的典型应用。提出到2025年,训练芯片支持FP16、FP32和混合精度(FP16/FP32)处理能力,智能算力集群节点扩展规模不低于1024卡,实现通用文本数据集规模总量达到10TB、通用图文数据集数据总量达到1亿对、通用音视频数据集数据总量达到100TB等预期目标。

图片

3、韩政府发布AI发展计划将投约50亿人民币
韩国科学技术信息通信部长官李宗昊13日出席在首尔举行的“韩国超大型人工智能发展会议”,并发布了有关AI发展的新计划。根据该计划,韩国政府将在AI全民日常化领域投入9090亿韩元(约合49.8亿元人民币),以提升在AI领域的竞争力。李宗昊表示,韩国政府将从2024年开始同美国、加拿大、欧盟等地的高校开展国际联合研究,建立AI共同实验室,外派硕士、博士级人才进行交流。

4、美国国会AI论坛落幕,监管AI或达成共识
据多家外媒报道,当地时间13日,美国国会参议院多数党领袖舒默举办的闭门会议“人工智能洞察论坛”落幕,马斯克、盖茨、扎克伯格等科技领袖和60多名参议员在会上讨论了人工智能的潜力和风险。据报道,会议现场对于政府是否需要在监管人工智能方面发挥作用方面达成共识,在场的60多名参议员都举手同意。舒默称,要在几个月内通过相关立法。据《华尔街日报》报道,会议也出现了一些争论,主要集中于人工智能系统是否“开源”以及对人类工作构成的潜在威胁这两个问题。
 
5、深圳市发布2024年芯片资助计划,最高资助3000万元
深圳市科技创新委员会发布了2024年度集成电路专项资助计划项目申请指南。申请时间为今日开始,截止日期为10月29日。最高资助总额为3000万元。资助内容包括对集成电路设计企业流片支持、购买IP支持和EDA设计工具研发支持。申请单位需在深圳注册,具备研发条件,并符合专项条件。详细信息可查看申请指南。

6、第二届机器学习算法与自然语言处理大会将于2023年9月23日-24日举行
中国人工智能学会和中南大学将联合主办第二届机器学习算法与自然语言处理大会(MLNLP2023)。大会旨在为学者提供学术交流平台,内容涵盖大模型构建与微调、大模型与推荐系统、大模型评估与安全、多模态多语言大模型、大模型与知识图谱以及大模型技术与应用等6个论坛。大会免费注册,通过官网线上交流专区深度参与学者讨论。

7、多篇论文被发现隐瞒ChatGPT使用情况
自4月以来,法国图卢兹大学的一位计算机科学家Guillaume Cabanac已经标记了十几篇包含泄露ChatGPT短语“重新生成响应”或“作为人工智能语言模型,我……”的期刊文章,并将它们发布在同行评审平台PubPeer上。Cabanac还在Elsevier爱思唯尔期刊上发表的几篇论文中发现了典型的ChatGPT短语。爱思唯尔的一位发言人告诉Nature,出版商“意识到了这个问题”,正在调查。

02
人工智能研究动态

1、研究团队提出新方法扩展语言模型上下文窗口
研究团队提出了一种名为YaRN的方法,可以扩展基于Transformer的大型语言模型(LLM)的上下文窗口。该方法通过插值和动态缩放的方式,使模型能够处理更长的序列,提高了模型的性能。实验结果显示,YaRN方法在扩展上下文窗口和困惑度方面优于其他方法。这一研究成果有望提升语言模型的能力,进一步推动自然语言处理领域的发展。

2、研究者使用大语言模型解决P vs. NP问题
研究者提出了一种名为\苏格拉底推理\的框架,利用大语言模型(LLM)来解决理论计算机科学中的P vs. NP问题。他们使用GPT-4进行试点研究,在97轮对话中得出了\P≠ NP\的结论。这项研究展示了LLM推断新知识并与人类合作探索复杂问题的潜力。研究者强调LLM是通用创新领航者,与专门AI模型不同。这项工作为解决具有挑战性的问题提供了系统的提示框架。

3、华人团队推出Medusa简单框架 LLM推理提速2倍
来自普林斯顿、UIUC等机构的华人团队提出一个用于加速大型语言模型(LLM)推理速度的简单框架Medusa,并于9月12日开源发布。测试结果显示,Medusa可以将LLM的生成效率提高约2倍。

4、中国研究人员开发出新的深度学习模型GLCNN
中国浙江大学的研究人员开发了一种名为GLCNN的特殊程序,可以帮助研究人员更好地理解催化剂在表面上的化学反应细节。GLCNN可以将表面和分子附着点转化为简单的网格和数字列表,从而预测分子在表面上的附着情况。该模型在预测催化剂的工作效果方面表现出色,能够更准确地预测催化剂的性质和形状。这一研究有助于提高计算机在化学领域的预测能力,为设计新的催化剂提供帮助。

5、研究发现Transformer架构中的冗余问题
研究人员发现,在Transformer设计中,特别是在解码器层中,Feed Forward Network(FFN)存在冗余问题。通过删除解码器层中的FFN,并在编码器层中使用一个共享的FFN,可以显著减少模型的参数数量,而准确性只有轻微下降。此举不仅减轻了模型的计算负担,还提高了其在各种自然语言处理应用中的效果和适用性。这项研究为优化Transformer架构提供了新的思路。

6、伊利诺伊理工学院研究者提出新方法加速扩散模型生成
伊利诺伊理工学院的研究者提出了一种新的方法,可以加速扩散模型的生成过程。他们使用后训练量化(PTQ)来压缩噪声估计网络,实验结果表明,这种方法可以将全精度的扩散模型量化为8位模型,并且在性能上保持甚至提高。这项研究对于加速人工智能前沿研究具有重要意义。

03
人工智能企业动态

1、英伟达推出新应用,在H100 GPU上增强大语言模型推理能力
近日,英伟达官方宣布,英伟达将为H100 GPU推出专用于大模型推理的加速程序,增强其推理能力。英伟达表示,通过和多家AI公司合作,英伟达推出了大模型推理优化程序TensorRT-LLM,借助该程序,大模型的推理速度将会翻倍。英伟达表示,在优化后的H100上,Llama 2的推理速度达到了未优化版本的1.77倍,而GPT-J-6B的推理速度达到未优化版本的2倍。
 
图片

2、台积电押注「硅光子」,以实现更强大的ChatGPT
9月6日的国际半导体展硅光子论坛上,台积电副总经理余振华表示:「如果能提供一个良好的硅光子整合系统,就能解决能源效率和AI运算能力两大关键问题。」市场传闻,台积电、英伟达以及博通正合作开发以「硅光子」为基础的超高速运算芯片,台积电已经投入了超过200人的前期研发团队。硅光子技术由英特尔在2010年推出,结合硅及镭射技术,透过将电转换成光,让原本由铜线传输资料转换成传输距离更快速、更稳定的光纤。相较于「微电子」芯片,硅基光电子芯片既可利用微电子技术在低成本、大规模CMOS集成方面的优势,又兼具光信号在传输过程中衰减小、传输带宽高、传输速率快、抗干扰性能强、功耗低等优点,最终改善人工智能、移动计算应用。

3、传谷歌Gemini接近发布 已开启小范围内测
据知情人士透露,谷歌已向一部分公司提供了其对话式AI产品Gemini的早期版本,这可能意味着谷歌即将把它纳入其消费者服务,并通过公司的云计算部门出售给企业。一位测试过Gemini的人士表示,与GPT-4相比,Gemini有一个优势在于,除了公共信息外,该模型还利用了来自其消费产品的大量谷歌专有数据进行训练。他表示,这使得Gemini在理解用户特定查询的意图时特别准确,而且它似乎会产生更少的错误答案(即幻觉)。另一位人士表示,谷歌计划通过其谷歌云Vertex AI服务向企业提供Gemini,并将发布不同大小的版本,以便开发人员可以付费购买不太复杂的版本来处理简单的任务或一项复杂的任务。它足够小,可以在个人设备上运行。该人士补充说,谷歌目前正在向开发人员提供相对较大的Gemini版本,但不是其正在开发的最大版本,后者将更接近GPT-4。

4、阿里云通义千问向全社会开放
9月13日,阿里云于微信公众号宣布通义千问大模型已首批通过备案,并正式向公众开放,用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。今年4月,阿里云通义千问开启邀测,目前已与OPPO、得物、钉钉、淘宝、浙江大学等企业或机构达成合作。8月,阿里云宣布免费开源通义千问70亿参通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线公司旗下魔搭社区。阿里云称,近期将开源一个更大参数规模的大模型版本,供全社会免费商用。

5、腾讯混元大模型首批通过备案 将面向公众开放
腾讯宣布旗下的腾讯混元大模型已首批通过《生成式人工智能服务管理暂行办法》备案,将正式上线,并陆续面向公众开放。据介绍,混元大模型是由腾讯全链路自研的实用级大模型,拥有超千亿参数规模、预训练语料超2万亿Tokens。

6、DeepMind:AI自己设计提示词最高提升50%性能
9月7日,谷歌DeepMind团队发表论文,称大模型自己设计的提示词在Big-Bench Hard数据集上的表现最高提升50%。团队称,如果在提示词中加上“深呼吸”(Take a deep breath),AI大模型的数学成绩可以再涨8.4分,而这个提示词是AI自己找出来的。用这个新提示词结合此前发现的“一步一步地想”(Let's think step by step),大模型在GSM8K数据集上的成绩可以从71.8分提高到80.2分。

7、游戏大厂Roblox推出AI聊天机器人
“元宇宙第一股”、国际游戏大厂Roblox在9月8日的第九届年度Roblox开发者大会(RDC)上宣布推出一款对话式AI聊天机器人Roblox Assistant,让创作者能够更快创建更丰富、更具吸引力的体验。创作者将能够输入关键字来创建虚拟场景,例如输入“制作一款以古代废墟为背景的游戏”。

8、微软发布13亿参数phi-1.5 多步骤处理表现突出
微软研究院机器学习团队主管Sébastien Bubeck于社交媒体X上宣布开源发布phi-1.5模型,拥有13亿个参数,适用于问答、聊天、代码等场景。据介绍,该模型基于Transformer架构,使用300亿Tokens的数据集,训练耗时8天。性能方面,论文给出图表,称在常识推理、语言技能和多步骤处理这三类基准测试上的表现基本优于同规模或更大规模的其他模型,包括Llama 2-7B、Falcon-RW-1.3B等,尤其是在多步骤处理上表现突出。

9、阿里新任CEO吴泳铭提出AI和用户两大战略重心
阿里巴巴集团新任CEO吴泳铭发布全员信,宣布确立两大战略重心:用户为先、AI驱动,并提出在此基础上对三类业务加大战略性投入,分别是技术驱动的互联网平台业务、AI驱动的科技业务以及全球化的商业网络。吴泳铭在信中提到,未来十年“最大的变量毫无疑问是AI带来的全行业深刻变革”,“如果跟不上AI时代的变迁”就一定会被取代。吴泳铭还提到,坚决实行团队年轻化,4年内让85后、90后作为主力管理者刷新业务管理团队。

10、国内首个医检行业AI开放创新平台上线
由金域医学承建的临床检验与病理诊断人工智能开放创新平台正式上线。这是国内首个医检行业人工智能开放创新平台,可满足开发者从数据管理到应用部署的一站式AI研发需求,具备全栈式、全流程、全场景的特点。

11、Stability AI推出音频生成产品Stable Audio
当地时间13日,Stability AI于官网宣布推出Stable Audio,这是该公司第一款用于音乐、声音生成的AI产品。据介绍,Stable Audio的底层模型是利用音乐库AudioSparx的音乐和元数据进行训练的,可根据用户提供的描述性文本提示以及所需的音频长度生成音轨,免费版可生成和下载不超过20秒的音轨,专业版订阅可提供90秒的音轨并可供商业项目下载。

12、蚂蚁集团发布“蚁天鉴”大模型安全一体化解决方案
近日,蚂蚁集团2023国家网络安全宣传周上发布了名为“蚁天鉴”的大模型安全一体化解决方案。这一解决方案包括两大核心产品:“蚁鉴2.0”大模型安全检测平台和“天鉴”大模型风险防御平台。这个解决方案可以从数据安全、内容安全、科技伦理等多个角度来保障大模型的安全性,并且支持多种数据类型的AI安全检测。

13、华为发布新车,称无限接近L3智能驾驶
9月12日,华为发布和赛力斯合作的AITO问界新M7系列车型,该车有五座和六座两个版本,官方定价为24.98万到32.98万元。余承东称,该车搭载的辅助驾驶系统无限接近L3级,无需依赖高精地图。

14、苹果发布新手机,芯片仅3nm
苹果发布了搭载全球首款3nm芯片A17 Pro的iPhone 15 Pro,采用航空级钛合金设计,性能和能效大幅提升。新款iPhone支持硬件加速的光线追踪,提供更真实的游戏和AR体验。拥有最好的摄像头系统,包括多个镜头和创新功能。采用钛合金外壳和超瓷晶面板,轻巧耐用。新增可自定义的操作按钮,提供更多的镜头选择和光学变焦。支持USB-C连接和快速传输功能。

15、VERTU发布新款METAVERTU手机,打造个人专属AI
奢华手机品牌VERTU在新加坡Token2049大会上预热了即将发布的新款METAVERTU手机。该手机采用自研的DOS云边端链操作系统,让用户的生活和工作可以被数字化记忆下来连接大模型进行训练,并用区块链技术进行高度隐私保护,从而打造出自己的专属人工智能,即「第二大脑」。VERTU认为,METAVERTU的发布将标志着Personal AI时代的到来。通过手机掌握AI,而不是被AI替代,让每个人都可以拥有自己的个人人工智能。