发布时间:2024-11-25 01:46:17 来源: sp20241125
“我市已有百余款大模型产品,占全国总量的一半左右。”北京已然是我国人工智能行业发展的开拓先驱和创新高地。
近日,北京市经济和信息化局相关负责人在接受新京报贝壳财经记者采访时表示,北京各市场主体纷纷进入大模型赛道进行产品研发,并积极推进产业化落地,平均每月有10余家市场主体进入大模型赛道,保持较高的增速。
当前,生成式人工智能发展仍处于起步阶段,不过,随着一系列“杀手级”应用面世,其对各行各业工作方式所产生的影响不容小觑。在这位负责人看来,科研院所和头部大模型企业具备雄厚的资金储备和长期的技术积累,以关键技术攻关为目的,聚集顶尖人才,着力推动通用大模型的创新突破和国产自主可控,对标OpenAI等打造通用大模型底座。
人工智能应用扎堆涌入赛道,亦存在待解难题。这位负责人称,目前所面临问题包括智能算力资源供给紧张、高质量数据资源不足、典型应用场景开放力度不够等,相关政策措施正积极推动落地以解决大模型发展的难题。
着眼大模型“智”高地,预计到2025年,基本形成要素齐全、技术领先、生态完备、可有力支撑北京数字经济高质量发展的通用人工智能大模型产业发展格局。
市场
平均每月10余主体涌入大模型赛道
贝壳财经:当前北京市人工智能产业发展现状如何,已有多少款大模型产品?
经信局相关负责人:目前我市已有百余款大模型产品,占全国总量的一半左右。
当前,大模型成为各学术科研机构和人工智能企业关注的焦点。北京市具有人才资源丰富、技术力量雄厚、应用场景多样等大模型发展的先发优势,成为全国大模型发展的排头兵。
今年以来,我市各市场主体纷纷进入大模型赛道进行产品研发,并积极推进产业化落地,平均每月有10余家市场主体进入大模型赛道,保持较高的增速。在大模型蓬勃发展的同时,我们也遇到一些亟待解决的问题,包括智能算力资源供给紧张、高质量数据资源不足、典型应用场景开放力度不够等,我们正积极推动相关政策措施落地以解决大模型发展的难题。
贝壳财经:近期,全国十余家企业相继发布通用大模型产品,如何看待通用大模型与垂类大模型的关系?
经信局相关负责人:我们正密切关注大模型的发展态势,密集开展企业调研和座谈交流,了解企业发展动态。我们看到,目前的主要发展方向是,以通用大模型为底座,加速推进大模型在垂直领域应用落地见成效。
通用大模型是大模型的应用底座,头部大模型企业和科研院所聚焦突破大模型技术能力天花板。强大的通用模型能力需要更多的预训练参数、更大的算力资源、更强的模型算法。这背后离不开数据、算力和人才资源的支持。科研院所和头部大模型企业具备雄厚的资金储备和长期的技术积累,以关键技术攻关为目的,聚集顶尖人才,着力推动通用大模型的创新突破和国产自主可控,对标OpenAI(开发ChatGPT的人工智能研究公司)等打造通用大模型底座。
垂类大模型基于通用大模型底座实现下游场景的应用适配,具备产业优势的垂类大模型企业正探索大模型在典型场景的应用落地,实现商业闭环。垂类大模型企业在各自所属领域均拥有相当数量的用户资源储备,能够快速获取较高质量的行业数据资源,利用其自身在行业领域的数据沉淀优势,可推动垂类大模型在垂类细分领域应用转化,加速大模型应用落地进程。
通用大模型打造技术底座,垂类大模型实现各行业应用落地,两者协同发展,推动大模型技术赋能千行百业数智化转型。
推动
今年底一批智能算力中心将建成
贝壳财经:作为国内大模型创新基础最好,人才团队最集中,研发能力最强,以及产品迭代最活跃的地区,出台了哪些措施支持和促进行业发展,取得什么成效?
经信局相关负责人:为支持我市通用人工智能产业发展,我市出台了《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》《北京市促进通用人工智能创新发展的若干措施》《北京市通用人工智能产业创新伙伴计划》等政策措施。充分发挥政府引导作用和创新平台催化作用,整合创新资源,加强要素配置,营造创新生态,重视风险防范,推动本市通用人工智能实现创新引领和理性健康发展。围绕提升算力资源统筹供给能力、提升高质量数据要素供给能力、推动通用人工智能技术创新场景应用等几个方面开展工作。
算力供给方面,我们正积极推进人工智能算力中心项目建设,海淀区人工智能算力中心和朝阳区北京数字经济算力中心项目正在加紧实施,今年年底将有一批智能算力中心正式建成;石景山、门头沟、大兴、丰台4个商业化智算中心建设工作也在积极推进过程中。
数据开放方面,我们出台了《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》,同时,积极推进高质量数据资源开放。截至目前,我们发布了两批总量约612TB的支持大模型训练的高质量数据集,对大模型企业起到了助力作用,已有多家大模型企业与数据提供方开展合作对接。
企业服务和应用场景开放方面,我们以北京市通用人工智能产业创新伙伴计划为抓手,搭建人工智能大模型开放合作平台,建立协同合作机制,推进合作伙伴协同联动,服务本市大模型企业发展。我们通过伙伴计划积极推进工业、政务、金融、医疗、法务、消费等典型应用场景与大模型企业的对接,截至目前,伙伴计划共计组织50人以上各类对接活动6场(其中100人以上高规格活动2场),累计服务企业近200家次,发布了50个应用场景,促成了13个大模型应用场景签约合作。
我们正积极配合政务服务局,加快推进智慧政务大模型的迭代部署,在业务专家的协助下已经开始对公积金、市场监管、公安交管、规划等领域的应用进行强化学习,积极协调算力资源,满足政务大模型训练过程中的算力需求。同时,开放局内政务应用场景,探索大模型服务智慧政务典型经验,打造政务服务领域标杆试点应用。
挑战
要加强技术安全性和伦理审查
贝壳财经:破解应用落地难题,正在哪些方面发力?
经信局相关负责人:大模型作为人工智能最新的产业发展范式,具有较高的技术门槛,在应用落地过程中也存在核心资源供给不足和高成本的问题。为更好地推动大模型在垂直行业加速落地,我局以“伙伴计划”为抓手,建立协同合作机制,推进合作伙伴协同联动,实现资源供给充裕、应用落地见效、合作机制灵活的良性发展态势。
一是提升“通用大模型”底座支撑作用,鼓励相关市场主体开源更高参数版本的通用大模型,为垂类大模型的落地应用提供更强的通用能力支持,降低大模型应用落地过程中的整体技术门槛,避免垂类大模型企业进行通用底座大模型研发带来的资金和资源浪费。
二是加快推进我市智能算力中心建设,为我市垂类大模型应用落地提供更多的算力资源支持;为开展大模型应用落地相关工作的企业提供“算力券”补贴支持,切实降低大模型企业智能算力使用成本。
三是创新大模型应用落地合作机制,政府搭台、企业主导,引导大模型企业与应用企业建立互利共赢的合作方式,应用企业为大模型落地提供必要的数据资源和行业专家支持,加快大模型在垂直领域的应用落地速度。
贝壳财经:生成式人工智能发展,也伴随着一些争议,如版权、内容安全等,北京经信局是否针对这些潜在的伴生风险采取措施?
经信局相关负责人:生成式人工智能快速发展对互联网内容领域带来深刻变革,不仅提高了内容的生成效率和交互性,还拓展了在创意和设计领域的应用范围。但同时也需要注意到技术发展带来的新挑战,如数据隐私、内容安全和伦理问题等,需要加强技术治理和社会监管。
今年7月,国家网信办联合多部委公布《生成式人工智能服务管理暂行办法》,明确生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性。
我们组织开展政策解读活动,邀请国家互联网应急中心技术专家和中科院人工智能专家,对《办法》出台背景、法律责任、合规义务、发展指引等内容进行了深入解读,就提供者使用者责任界定、模型开源管理、数据标注等关键环节进行了现场答疑,有效回应企业关切。
我们认为,针对生成式人工智能潜在的伴生风险,需通过制定和完善相关法律法规、加强技术安全性和伦理审查、建立完善测评体系、增强用户安全意识等方式预防相关风险。通过多方面措施的落实,共同推动生成式人工智能技术的健康发展。
规划
加速典型应用场景落地
贝壳财经:推动大模型产业发展,未来有哪些规划?
经信局相关负责人:我市将以场景应用为牵引,汇聚产业链上下游合作伙伴,加速大模型行业应用落地,赋能千行百业数智化转型,建成具有国际影响力的人工智能大模型产业高地。预计到2025年,基本形成要素齐全、技术领先、生态完备、可有力支撑北京数字经济高质量发展的通用人工智能大模型产业发展格局。着眼长远,从算力、算法、数据及治理层面协同发力,加快推进我国自主大模型创新迭代,加速典型应用场景落地,夯实我市数字经济产业底座。
多维度提升我市算力供给能力。一是加快编制我市算力基础设施建设规划,进一步完善我市算力中心建设和算力供给体系,按照统筹全局、优势互补的原则,打造以智能算力为主、通用算力和超算算力相协同的算力供给体系,并积极引导算力资源在功能和空间上实现梯度分布,着力提升网络运力承载水平,促进算力中心绿色高效安全可控。二是同步研究京津冀算力调度平台建设,争取实现区域算力资源动态统筹,提高环京地区算力一体化服务能力,形成全国算力网络调度枢纽节点。三是加大高性能计算芯片生态搭建工作,积极推动国产化适配,支持研发一批具备自主可控能力的图形GPU、通用GPU等芯片,保障我市人工智能产业供应链韧性和安全水平。目前,我们正大力推进公共算力中心建设,积极引导老旧小散数据中心向智能算力中心转型升级。我局已经与河北、内蒙古签署合作协议,鼓励企业在两地建设专供北京市场的智算中心。
多举措加大开源数据集支持力度。一是以数据基础制度先行先试示范区为依托,制定国家级数据训练基地建设方案,以解决数据数量相对匮乏、质量难以保障、采集标注成本高及合规使用等问题,按照监管沙箱机制进行数据交易,完善政府公共数据资源开放清单,研究推出白名单策略,对白名单企业开放高价值数据资源。二是面向重点行业搭建公共数据开放平台,针对医疗、教育、政务、金融等场景,围绕大模型企业需求,建立数据供需双方权益体系,推动公共数据和社会数据特别是重点企业语料库合作,形成高质量数据集。三是支持数据标注行业高质量发展培育高水平数据标注团队,满足大模型调优对行业数据领域广、质量高的要求。
多领域培育行业应用生态。我们正加快编制大模型在医疗、政务、金融等重点行业垂直领域应用落地的工作方案,在智能分诊、诊后随访、政务服务、政策咨询、金融风控等领域遴选一批应用场景,按照尽职免责原则开展试点示范应用,强化结果评估。系统化解决推进大模型应用落地过程中存在的通用大模型开源难、专业数据资源开放难、智能算力资源获取难、商业化落地推进难等问题,加速大模型在各典型应用场景尽快形成标杆应用,推动形成商业化闭环。
多部门联合建立大模型评测体系。协调相关行业主管部门及权威机构,商讨建立大模型安全和技术评测体系,按照相关测评指标,对大模型产品进行测试评估。建立评估工作小组,围绕真实应用场景模型生成结果定期开展质量评估,促进大模型产品安全合规发展,并为大模型产品最终获批上市提供依据,推动大模型商业化落地进程。
多渠道宣贯生成式人工智能伦理和安全相关政策。时刻关注科技伦理和技术安全相关领域的法律法规,与市委网信办保持密切沟通,共同组织相关政策宣贯,引导企业安全合规发展。
今年以来,我市各市场主体纷纷进入大模型赛道进行产品研发,并积极推进产业化落地,平均每月有10余家市场主体进入大模型赛道,保持较高的增速。在大模型蓬勃发展的同时,我们也遇到一些亟待解决的问题,包括智能算力资源供给紧张、高质量数据资源不足、典型应用场景开放力度不够等,我们正积极推动相关政策措施落地以解决大模型发展的难题。
新京报贝壳财经记者 陈维城 【编辑:宋宇晟】