
2023年3月17日上午,“从ChatGPT到GPT-4:新一轮人工智能变革与挑战”高峰论坛在西安电子科技大学成功举办。此次论坛邀请了6位知名专家学者:欧洲科学院外籍院士、俄罗斯自然科学院外籍院士、IEEE/IET/CAAI/CAA/CIE/CCF Fellow、西安市人工智能产业发展联盟理事长焦李成院士,国家级人才、中国人工智能学会教育工作委员会主任、浙江大学求是特聘教授、浙江大学上海高等研究院常务副院长、人工智能研究所所长吴飞教授,国家级人才、西安交通大学大数据算法与分析技术国家工程实验室机器学习教研室负责人孟德宇教授,国家级人才、中国人工智能学会副理事长、IEEE/CAAI/CAA Fellow、清华大学孙富春教授,探知图灵科技(西安)有限公司CEO徐巍以及西安维塑智能科技有限公司CTO褚智威,他们围绕人工智能核心技术的内涵展开探讨,特别关注了ChatGPT、GPT-4、大模型等领域最新技术进展,以及在推进这一过程中所面临的挑战,并展望下一代人工智能技术及其可能带来的变革。本文根据论坛期间现场速记进行整理归纳,将专家们提出的主要观点再次呈现,供读者参考。

论坛由西安电子科技大学、西安市科学技术局主办;智能感知与图像理解教育部重点实验室、智能感知与计算国际联合研究中心、智能信息处理国家级创新引智基地、智能感知与计算国际合作联合实验室、西安电子科技大学计算机科学与技术学部、西安电子科技大学人工智能学院、西安电子科技大学人工智能研究院、西安市人工智能产业发展联盟承办;“一带一路”人工智能创新联盟、陕西省人工智能产业技术创新战略联盟、陕西省自动化学会、西安人工智能研究院、探知图灵科技(西安)有限公司协办。
焦李成:《从ChatGPT到GPT-4看下一代人工智能的挑战与机遇》

焦李成院士的报告主要包括ChatGPT的社会影响及发展历程、ChatGPT的技术原理及挑战、GPT-4和其他大模型、未来人工智能的挑战与机遇四个方面的内容。
首先,焦院士对ChatGPT的发展现状和社会影响进行了梳理。他对国际上各界人士对于ChatGPT的看法和观点进行了总结,同时对GPT系列模型的发展历程进行了介绍,他指出ChatGPT的成功实际上源于自然语言处理领域七十年的长期发展和积累。然后,焦院士重点从微调方法,Transformer表征能力,以及强化学习优化方法三个方面对ChatGPT的技术原理进行了深入剖析,并对其现阶段特点和不足进行总结。具体而言,焦院士从模型架构、数据收集、人工微调,基于人类反馈的强化学习等方面对ChatGPT的核心技术进行了逐一讲解。焦院士进一步提出,ChatGPT仍然处于发展的初期,具有资源消耗高、存在结果一致性问题、跨模态的性能还不突出等技术特点和局限性。他还对ChatGPT数理逻辑计算、语义感知认知以及视觉环境感知能力薄弱,存在模型偏见,语音识别难题等挑战结合具体示例进行了详细解析。焦院士认为,我们应该以创造性的思维拥抱ChatGPT,无论是基础理论、软硬件系统、核心技术,还是其它的场景应用,我们还有很长的路要走,有许多的领域需要进行核心算法和基础理论的深入研究与革新。焦院士对最新的GPT-4和其他大模型进行了介绍,重点对GPT-4的技术改进和性能表现进行了讲解,同时对微软提出的Visual ChatGPT,商汤科技提出的“书生”2.5,阿里提出的M6,华为提出的盘古大模型,清华大学提出UniDiffuser扩散大模型,西电提出的遥感脑大模型,探知图灵研发的教育版ChatGPT等一批大模型进行了分析。最后,焦院士从人工智能的思想起源和国家政策层面对人工智能的发展进行了剖析,并对下一代人工智能的发展进提出了思考与展望,ChatGPT启示我们更需要从源头去创新,从生物机理、物化原理,数学建模、算法设计与优化、硬件设计与实现、开放的环境感知、重大的应用场景等角度,杜绝短板,去全面探索,建立我国全栈式的人工智能生态环境。
吴飞:《从ChatGPT和GPT-4看人工智能创新与发展》

吴飞教授首先从深度神经网络的基本单元、工作原理和特点出发,分别介绍了深度神经网络、循环神经网络以及Transformer网络,带领大家全面回顾了深度神经网络的发展史。之后,吴教授分别对ChatGPT和GPT-4的技术原理进行了介绍和总结,重点讲解了ChatGPT完形填空下的自监督学习、提示学习以及人类反馈下的强化学习三个部分技术原理,他指出ChatGPT按照“共生则关联”实现了统计关联关系的挖掘,是深度学习、强化学习以及符号主义三大主义的结合。在此基础上,吴教授对GPT-4的“挖掘Visual-Textual之间多模态关联关系”的预训练模型进行了详细分析。同时,吴教授也对词向量参数、注意力参数以及前向传递参数这三种模型参数进行了介绍与分析。他指出参数是模型学习单词和单词如何进行关联的关键,具有计算独大、表示丰富以及机理式微的优势和特点。接着,吴教授对ChatGPT具有涌现能力,以及ChatGPT未能掌握知其然且知其所以然的因果关系的特点进行阐述和总结,并提出ChatGPT具有成为人工智能时代的一种新的信息系统入口、一种新的知识调用方式的趋势。最后,吴教授认为ChatGPT朝着通用目的技术方向进行发展,使得人工智能更的广泛应用至各个领域中,发挥基座能力,同时大模型不是人工智能的唯一出路,大小模型协同进化也是未来的发展方向。
孟德宇:《基于模拟学习方法论(SLeM)的算法研究进展》

首先,孟德宇教授从训练数据集、学习机器、表现度量、优化算法角度回顾了传统机器学习的框架,总结传统机器学习需要人工筛选训练样本、标注训练数据、预建网络结构、预制表现度量、预设优化算法的人工设定学习流程现状。针对这一现状,孟教授提出了机器学习方法论自动化构建与设置这一关键问题。然后,孟教授从元学习机、支撑-查询任务对以及双边优化三个方面深入阐述了元学习的主要思想及框架,重点讲解了元学习的理论、运行机制和方法实现。孟教授以深度学习的鲁棒性学习问题为背景,介绍了元学习方法的解决方案。具体而言,孟教授针对样本加权这一类典型的处理数据偏差的方法论展开讨论,对该方法论从传统手工赋权设定方法到自动化赋权方法的发展历程进行了梳理。特别地,孟教授分别利用MW-NET和CMW-NET这两种自动化赋权方法阐释了元学习的基本思想和步骤和效果,深入剖析了该方法论背后蕴含的元学习思想本质及理论内涵。最后,孟教授从元学习的理论基础、元学习基础算法簇、原学习算法工具包以及元学习示范应用四个方面对元学习的未来研究发展方向进行了总结和展望。
孙富春:《从深度学习到ChatGPT看人工智能的未来发展》

孙富春教授首先回顾了深度学习的发展历程,并以生物启发和脑科学为背景,介绍了稀疏编码、Gabor滤波器、卷积神经网络以及Vision Transformer等经典深度学习模型。之后,孙教授重点介绍了GPT的发展历程及其核心技术和问题。OpenAI的ChatGPT是生成式人工智能浪潮(AIGC)的一部分;2018年,GPT-1(1.17亿参数)能够用于和监督任务无关的NLP任务;2019年,GPT-2(17亿参数)可以进行阅读理解、聊天、编故事、生成假新闻或钓鱼邮件等;2020年,GPT-3(1750亿参数)作为一个自监督模型,可以完成NLP的绝大部分任务;2022年,InstructGPT为微调版的GPT-3,可以将有害的和有偏差的输出最小化;2022年12月,ChatGPT发布,它是InstructGPT的衍生产品,可以将人类反馈纳入训练过程,促使模型输出与用户意图保持一致;2023年3月15日,OpenAI正式推出GPT-4,与前代相比,GPT-4能接受图像和文本输入上限更高,有强大的识图能力。ChatGPT使用的数据集仅到2021年,如何有效及时介入新数据和减少训练资源消耗是很大的挑战,同时ChatGPT不具备记忆功能,还不能触及推理判断乃至情绪。
对于ChatGPT未来如何发展,孙教授指出应减少人类反馈的RLAIF,使用人工智能反馈代替人类对表达无害性的偏好。同时,还要关注补足数理短板和实现ChatGPT的小型化。孙教授分析了大型语言模型与人脑语言处理系统的相似性,它们具有结构相似性和功能相似性。最后,孙教授指出,AI大模型的出现有望改变信息产业格局,加速AI产业化进程,但还有一些问题需要我们持续研究和探索,以促进人工智能技术的可持续发展,分别是人工智能的伦理问题和道德问题、数据隐私和安全、自主学习和自主决策、可解释性和透明度、自然语言处理和识别、机器人技术和数据驱动的决策。
徐巍:《如何利用ChatGPT模型结合行业创业》

徐巍CEO首先梳理了GPT的发展历史,从GPT-1到GPT-4,现在已经可以完成涉及文字语言类的一切工作、代码编写调试和修复、绘画和语音识别等一系列任务。紧跟ChatGPT的步伐,探知图灵发布了教育版ChatGPT,可以完成人工智能教学助手、辅导学生家庭作业、学生情感分析、心理状态分析等应用,围绕教育场景,为本科、高职、中学以及高校提供高校且精准支持。徐巍CEO列举了大量ChatGPT的应用场景,例如,可以为广告行业赋能,可利用GPT生成广告创意文案及视频;为读书论文分析师行业赋能,GPT可以光速读书、论文或者行业报告,然后生成总结摘要;为能源企业赋能,可以预测煤价进行煤矿智能调度,为钢铁厂设计高炉GPT模型以降本增效;为金融股票行业赋能,训练金融行业专属模型生成专业股票分析,以及进行银行业务GPT问答与办理;为旅游业赋能,可推荐好吃好玩以及最佳旅行路线。最后徐巍CEO讨论了普通人如何挖掘GPT的商业机会,例如,可以利用GPT及人工智能的能力服务未被满足的空白产业,针对不同行业进行数据训练,提供企业降本增效方案;可以进行知识付费,做社群课程售卖,提供专业提示词等等。
褚智威:《多模态数据在三维人体重建与分析场景下的应用》

褚智威CTO首先介绍了维塑科技的概况,经过多年发展,维塑科技的多模态数据初具规模,分别包括:体成分分析、动态功能筛查、体征检测、体能测试、静态体态评估和肌肉维度测量等。维塑科技的DPF动态体态分析技术利用可见壳技术与生成对抗方法,可以实现对被测者姿态及肌肉受力及骨骼形态进行分析。其中的技术挑战与难点包括:衣物影响去除(筛查场景)、脂肪影响、全身骨骼肌肉拟合以及三维人体模型-文本的多模态匹配。他还介绍了西安市人工智能产业发展联盟,该联盟由西安电子科技大学和蒜泥科技牵头,已吸纳180家会员单位(15所高校,4家研究机构,161家重点企业),它的定位是打造西安市人工智能产业专业服务平台,本着创新、链接、融合、共赢的宗旨,实现整合高校、科研院所、龙头企业等资源。联盟包括七大核心服务:政策咨询、政企对接、专家指导、人才培养、技术引进、成果引进和赛事论坛。四大职能包括技术赋能、人才赋能、政策赋能和市场赋能。