2023全球人工智能创新指数:中美稳居领先,中国发展潜力待挖掘
在2024年7月4日下午举行的世界人工智能大会科学前沿主论坛上,由中国科学技术信息研究所与北京大学联合研制的《2023全球人工智能创新指数报告》正式发布。中国科学技术信息研究所党委书记、中国软科学研究会副理事长赵志耘在发布会上介绍,尽管美国和中国在总体格局上保持领先,但中国尚未形成绝对优势的核心竞争力。
《报告》从基础支撑、资源与环境、科技研发、产业与应用、国际合作交流等五个维度出发,评估了46个国家在人工智能创新发展和治理方面的情况。根据总得分、国家间分差以及一级指标排名等因素,报告将这些国家分为四个梯队,其中美国和中国位居第一梯队,总得分显著高于其他国家,且与第二梯队的差距进一步扩大。
美国和中国稳居全球人工智能领先梯队
总体来看,2023年,美国和中国在全球人工智能领域稳居第一梯队,英国、日本、新加坡等9个国家位居第二梯队。美国以74.71的总分遥遥领先,中国紧随其后,总分为52.69分,比排名第三的英国高出近15分。美国在多个指标上表现突出,与中国形成明显的领先优势。自指数创建以来,美国一直稳居全球第一,而中国则从2020年起连续四年位居第二。
《2023全球人工智能创新指数报告》发布
《报告》指出,美国和中国在高层次人才数量和人工智能企业数量上均遥遥领先于其他梯队国家。在主要国家的人工智能顶级论文数量和专利授权数量方面,中国远高于美国。例如,在人工智能顶级论文数量占比上,中国占36.7%,而美国仅占22.6%。在人工智能专利授权数量占比上,中国占34.7%,美国占32%。
此外,《报告》还提到,英国在教育资源和学术研究成果方面表现突出,日本在专利授权方面也颇具优势。德国在产业和应用方面尤为突出,特别是在人工智能风险投资和国内市场规模方面。
美国人工智能企业在机器学习模型研发中表现突出
综合当前全球人工智能创新发展趋势,赵志耘指出了四个主要特点。
首先,大模型的突破加速了人工智能技术创新,尤其是在自然语言处理和多模态领域。多模态模型的数量从2022年的9个增加到了2023年的35个。值得注意的是,人工智能在科学研究领域的应用不断深入,涉及生物/医药、地球科学、数学和材料科学等多个领域。
全球趋势观察
其次,产业界在机器学习模型开发方面显示出明显的领先优势。《报告》显示,2023年,产业界独立研发的机器学习模型达到176个,是学术界数量的3.5倍。
澎湃科技注意到,在2023年推出两个以上机器学习模型的13家机构中,美国有7家,表现尤为突出。谷歌成为研发最多机器学习模型的公司,其数量达到19个。中国有2家(阿里巴巴、北京智源人工智能研究院),英国、加拿大、法国和阿联酋各有1家。
《报告》同时指出,过去十年中,产业界独立研发的机器学习模型数量占比从2013年的25%增长到了2023年的62.6%,而学术界的比例则持续下降,拉大了与产业界的差距。
第三,生成式人工智能开源项目大幅增加,开源模式依然是人工智能技术研发和应用的重要模式。《报告》指出,过去十年间,GitHub上的人工智能开源项目总数持续增长,从2013年的1.2万个增加到了2023年的约190万个。印度成为最大的开源项目贡献国,其年度贡献占比从2013年的3.1%增至2023年的27.3%,自2020年起超过美国。
最后,人工智能企业的新增数量开始上升。2023年,生成式人工智能的风险投资规模急剧扩大,主要集中在美国、法国、中国、以色列和英国等国家。在2018年至2022年间,全球新增人工智能企业数量逐年减少,但2023年出现了反转迹象,新增企业数量同比增长了21.5%。
另外,虽然全球人工智能风险投资额呈下降趋势,但其下降幅度明显收窄。特别是生成式人工智能的风险投资规模快速扩大,对推动人工智能创新发展起到了重要作用。
《报告》也指出,中国在人工智能综合水平上保持全球第二,但仍需加强原始创新能力。在人才培养、科研成果和产业发展方面,中国取得了积极进展。
在高层次人工智能人才方面,顶会和顶刊论文的作者数量从2018年的328人增长到2022年的1674人,与美国的差距在逐步缩小。中国在顶级论文数量上已超过美国,位居全球第一,而在高影响力人工智能开源项目方面,中国则排名第三,仅次于美国和印度。
尽管如此,赵志耘指出,从目前主流技术路径和支持技术大规模应用的基础条件来看,中国在数据开发利用和原始创新方面仍有待加强。
赵志耘还表示,中国应加快高水平、大规模应用的步伐,这将是中国的主要优势所在。此外,还需加强数据资源建设,完善公共数据开放共享机制,建立安全合规、高质量的语料库。同时,应加大高层次人才引进和培育力度,集中力量在关键领域打造一批技术领先、具有规模化潜力的重大应用场景,促进大、小模型的协同落地。