必发人工智能不断涌现的当|内参揭幕|下我们是否在见证MOSS的诞生?

2025-07-07 00:12 必发·bifa

  ▲2023年世界人工智能大会(WAIC)主论坛科学前沿全体会议(Plenary Session · Scientific Frontier)跨界对话环节中★◈★✿,张亚勤与郭帆跨界对谈活动现场★◈★✿。

  马瑞青★◈★✿:电影与科学之间联系紧密必发★◈★✿,电影艺术的存在依赖于科学发明★◈★✿,从照相术★◈★✿、移动影像到如今的三维及沉浸式影像★◈★✿,两者始终息息相关★◈★✿。今日早些时候发布了书生大模型★◈★✿,它能够实时渲染巨大场景★◈★✿,如天际LandMarkbf88必全站登入★◈★✿,★◈★✿。在此对话开场★◈★✿,有请张亚勤院士简要回顾人工智能的发展历史及现状★◈★✿。

  张亚勤★◈★✿:人工智能已有60多年的历史★◈★✿,近10年取得了重大突破★◈★✿,深度学习借助海量数据★◈★✿、大模型★◈★✿、算法和算力实现飞跃★◈★✿,尤其过去两三年实现从量变到质变的飞跃★◈★✿。以我首次接触GPT 4.0为例★◈★✿,其发展体现在三个方面★◈★✿:一是从感知到认知的跨越★◈★✿,过去侧重于语音★◈★✿、图像★◈★✿、字符识别等感知领域★◈★✿,如今更多地涉及推理★◈★✿、思考以及对语言和视频语义的理解等认知层面★◈★✿;二是从专用算法人工智能迈向通用人工智能★◈★✿,过去针对不同任务如语音★◈★✿、图像★◈★✿、自动驾驶★◈★✿、蛋白质解析等需特定算法★◈★✿、模型或数据集★◈★✿,如今则相对通用★◈★✿,虽然GPT 4.0尚未达到通用人工智能的程度★◈★✿,但提供了发展路径★◈★✿;三是从鉴别式或分析式人工智能发展为生成式人工智能★◈★✿,过去主要对内容事件进行分析★◈★✿、预测和决策★◈★✿,现在能够创造生成新内容★◈★✿,如文本★◈★✿、图片★◈★✿、视频★◈★✿、蛋白质★◈★✿、编码★◈★✿、工具等★◈★✿,今日发布的LandMark和书生便是例证★◈★✿。不过★◈★✿,目前人工智能技术在电影应用中尚不成熟★◈★✿,距离高清长电影的要求还有较大差距★◈★✿。

  马瑞青★◈★✿:今日发布的书生大模型实现了文本★◈★✿、图像★◈★✿、视频多模态互通与相互学习★◈★✿。请问郭帆导演★◈★✿,当前这些发展与电影等视听产业需求以及日常生产消费需求之间是否存在差距?若存在★◈★✿,差距体现在哪些方面?

  郭帆★◈★✿:看到上海人工智能实验室发布的书生模型★◈★✿,我深感震撼与自豪★◈★✿,同时也在反思★◈★✿。此前我对ChatGPT的使用较为随意★◈★✿,今后会更加礼貌★◈★✿。就您的问题而言★◈★✿,在实际应用中★◈★✿,《流浪地球2》已运用人工智能进行演员增龄★◈★✿、减龄及声音修复★◈★✿,通过数百次迭代生成★◈★✿。但目前AIGC生成的视频或图片精度尚未达到电影级别★◈★✿,不过在可预见的未来有望实现★◈★✿。因此★◈★✿,我们希望借此平台★◈★✿,与团队更多地了解新技术发展★◈★✿,从认识AI入手★◈★✿,探索未来发展方向内参揭幕★◈★✿,以学生的心态学习★◈★✿。

  马瑞青★◈★✿:您对人工智能的未来有何期待?例如在未来影片中★◈★✿,像《流浪地球2》中的减龄★◈★✿、增龄应用相对目前发布的应用较为狭窄★◈★✿,未来其可能拓展的形态难以预估★◈★✿,在对其缺乏深入了解时★◈★✿,很难判断★◈★✿。

  郭帆★◈★✿:我们此前常讨论★◈★✿,若生成视频的闪动统一性等问题逐步解决★◈★✿,鉴于电影由镜头组成★◈★✿,未来有望节省时间和资金成本★◈★✿。但是★◈★✿,这也会给行业内许多部门和艺术家带来冲击★◈★✿,引发危机感★◈★✿。

  张亚勤★◈★✿:从技术角度来看★◈★✿,上述问题有望在未来5年内得到解决内参揭幕★◈★✿。过去两年进展迅速必发888官网★◈★✿,★◈★✿,此前GAN(生成式对抗网络)等技术生成的图片存在诸多问题★◈★✿,如今已有很大的改进★◈★✿。若有需求★◈★✿,科学家和工程师可研发新算法★◈★✿,实现语义★◈★✿、镜头★◈★✿、场景的连贯性以及高质量输出★◈★✿,涵盖前期构思★◈★✿、摄影及后期制作★◈★✿。但是★◈★✿,无须过度焦虑★◈★✿,AIGC再好也只是工具★◈★✿,真正的创造力★◈★✿、创意★◈★✿、想象力和灵感仍源于作家★◈★✿、导演★◈★✿、演员等★◈★✿,AIGC无法替代★◈★✿,只会助力他们做得更好★◈★✿。关键在于创造良好的工具及人性化必发★◈★✿、简洁的界面★◈★✿,方便导演和演员使用★◈★✿。过去的电影特技制作★◈★✿,如《阿凡达》《泰坦尼克号》从2D到3D的转换★◈★✿,技术问题可以解决★◈★✿,重要的是创意和界面★◈★✿。

  马瑞青★◈★✿:请问郭帆导演★◈★✿,艺术是否可能反哺科学创新?科研灵感是否可能源自电影或艺术?除了提供技术解决方案★◈★✿,两者之间是否存在其他关系?

  郭帆★◈★✿:张院士的话在一定程度上缓解了我的焦虑★◈★✿。我们希望尽快掌握人工智能应用★◈★✿,在我们的领域已知约有24个应用方向★◈★✿,计划在未来通过作品尝试★◈★✿,包括短篇计划和未来电影计划★◈★✿,在前期创意★◈★✿、剧本创作★◈★✿、实际拍摄★◈★✿、后期制作★◈★✿、宣传发行等各个环节探索应用★◈★✿,测试可用性★◈★✿,明确哪些部分可立即应用★◈★✿,哪些部分尚需等待★◈★✿,这是未来半年多的计划★◈★✿。同时★◈★✿,我们也希望进行更多的考察★◈★✿,把握新技术的发展趋势★◈★✿。例如★◈★✿,《流浪地球2》拍摄时现场人员达2 200人★◈★✿,团队规模近3万人★◈★✿,传统制片逻辑难以协调如此大规模的人员★◈★✿,我们期待未来随着技术的发展★◈★✿,或许剧组人数会减少★◈★✿,但借助技术★◈★✿,协作能力可能会提升★◈★✿,实现上万人甚至上百万人同时协作★◈★✿。我们希望尽快构建起电影工业化3.0雏形★◈★✿。

  张亚勤★◈★✿:科幻与研究紧密相连★◈★✿,人类的好奇心★◈★✿、想象力和创造力主要体现在对宇宙和生命的探索上★◈★✿,科幻小说和电影多围绕这两个主题展开★◈★✿,如时空漫游★◈★✿、太空漫游★◈★✿、机器人★◈★✿、数字人虚拟等★◈★✿。许多发明灵感源自科幻小说或电影★◈★✿,如平板电脑★◈★✿、无人机★◈★✿、无人驾驶★◈★✿、激光武器等★◈★✿,灵感来源包括《星际迷航》《星球大战》《回到未来》《黑客帝国》等★◈★✿。我个人也深有体会★◈★✿,大学时观看《未来世界》★◈★✿,该电影讲述了机器人失控又被控制的故事必发★◈★✿,我受其启发努力学习信息论★◈★✿、控制论★◈★✿,后来从事人工智能机器人研究★◈★✿,近年专注于无人驾驶领域★◈★✿。此外★◈★✿,卫星通信最早的创意源自阿瑟·克拉克发表于1946年的科幻文章★◈★✿,他计算出在36000千米同步轨道布置三颗卫星就可以覆盖地球大部分区域★◈★✿,20年后第一颗卫星建设主要参考了该创意★◈★✿。阿西莫夫的“机器人学三定律”于20世纪40年代提出★◈★✿,至今仍在沿用★◈★✿。未来★◈★✿,科幻电影导演和科学家应携手合作★◈★✿,相互启发★◈★✿。

  马瑞青★◈★✿:我们此前将人工智能视为工具★◈★✿,探讨其在20多个工种中的应用及对效率的提升★◈★✿,进而思考我们与人工智能的关系★◈★✿。那么★◈★✿,在人工智能研发或接触过程中★◈★✿,无论是作为艺术创作者还是科学家★◈★✿,二位是否感受到人工智能带来的挑战或威胁?如何看待这些瞬间?

  郭帆★◈★✿:我确实感受到了挑战和威胁★◈★✿,否则不会在此探讨★◈★✿。例如★◈★✿,Midjourney生成的概念设计和分镜★◈★✿,让我们思考概念设计师的出路★◈★✿。在概念设计中★◈★✿,将文字转化为画面★◈★✿,经验丰富的概念设计师可能需花费一周时间★◈★✿,而Midjourney一晚就能生成一两百张图★◈★✿。我们的美术指导做过实验★◈★✿,将人工绘制和机器生成的图混合起来给导演看★◈★✿,首轮淘汰的多为人工绘制的图★◈★✿。在剧本方面内参揭幕★◈★✿,前几天我与刘慈欣老师交流时也提及★◈★✿,包括小说写作和剧本创作在内★◈★✿,虽目前生成的作品难以达到灵感闪现的高水平★◈★✿,但在一定水准上已具有可读性★◈★✿。这些应用已逐渐进入电影制作领域★◈★✿,我们担忧随着其应用的增多★◈★✿,学习艺术多年的传统艺术家未来该如何发展★◈★✿。

  张亚勤★◈★✿:部分工作可能会消失★◈★✿,但总体而言★◈★✿,文艺创作尤其是电影★◈★✿,其核心魅力在于故事情节★◈★✿、灵感★◈★✿、人性和情感★◈★✿,这是其生命力所在★◈★✿。Chat GPT★◈★✿、Stable Diffusion★◈★✿、Midjourney或Runway Clip等生成的内容缺乏这些要素★◈★✿,其灵感也源于人类★◈★✿。例如《流浪地球2》中的MOSS★◈★✿,技术上可实现语音合成★◈★✿、自然交互和不断学习等功能★◈★✿,但它没有自我意识和情感★◈★✿。我近期思考了三个概念★◈★✿:machine(机器)必发★◈★✿、brain(大脑)和minds(心智)★◈★✿。未来机器可能实现甚至超越人类的大脑功能★◈★✿,但无法拥有心智★◈★✿。MOSS虽可进化★◈★✿,但无自我意识和情感★◈★✿。我们不必过度焦虑★◈★✿,我个人的焦虑源于生成式AI算法存在问题★◈★✿,生成内容可能存在幻觉★◈★✿、非事实★◈★✿、造假等情况★◈★✿,在信息领域会产生影响★◈★✿,但这是可以解决的★◈★✿。下一代人工智能将走向新的物理智能★◈★✿、形体智能★◈★✿、生物智能★◈★✿,当AIGC应用于无人车★◈★✿、无人机★◈★✿、机器人时★◈★✿,若缺乏因果性和透明性★◈★✿,会带来更大的风险内参揭幕★◈★✿。在生物和生理领域风险更大★◈★✿,人机接口或芯片连接后★◈★✿,若AI影响大脑★◈★✿、决策★◈★✿、行为和思考★◈★✿,那就必须加以控制★◈★✿。因此★◈★✿,我签署了《人工智能风险声明》★◈★✿,呼吁重视人工智能风险的程度应等同于重视核武器★◈★✿、大流行疾病内参揭幕★◈★✿。但我相信人类有能力控制风险★◈★✿,既然能发明技术★◈★✿,就能掌控其发展方向★◈★✿,关键是要有风险意识内参揭幕★◈★✿。

  马瑞青★◈★✿:科学发明创造需要开源共享以实现迭代和精进★◈★✿,而艺术创作尤其是艺术家需要版权保护以获取支持★◈★✿,两者如何协调?在版权保护方面★◈★✿,如Midjourney★◈★✿,美国编剧工会罢工也是因为创作权益的问题必发★◈★✿,还有两位作家控告OpenAI学习其作品★◈★✿,这涉及张院士提及的伦理和治理问题★◈★✿。

  郭帆★◈★✿:此前张院士的发言提及系统复杂到一定程度会涌现★◈★✿。在此暂不考虑知识产权保护问题★◈★✿,面对涌现问题★◈★✿,知识产权保护可能需要后置★◈★✿。当系统足够复杂★◈★✿,如何控制涌现以及处理如意识定义等问题?若涌现产生新意识并重新定义世界和意义框架★◈★✿,我们应如何应对?

  张亚勤★◈★✿:“涌现”存在歧义★◈★✿,目前人工智能的涌现不会产生意识bf88必官网登入★◈★✿!★◈★✿,智能有限★◈★✿,模型参数增大使任务完成更准确★◈★✿,但未产生新的意识或情感★◈★✿。这类似蚁群或鸟类★◈★✿,个体能力有限必发★◈★✿,但群体聚集会产生特殊能力★◈★✿,人工智能中的涌现与之相似★◈★✿。这是现实探讨内容★◈★✿,或许可融入《流浪地球3》的创作★◈★✿。

  当前世界正处于百年变局★◈★✿,人类社会已经进入数字经济3.0时代★◈★✿:数字内容迭代★◈★✿,从1.0时代逐步迈入3.0时代★◈★✿;人工智能技术飞跃★◈★✿,从符号推理★◈★✿、深度学习走向知识+数据驱动的3.0时代★◈★✿;产业拓展更深更广★◈★✿,走向智能+3.0时代★◈★✿。随着大模型内参揭幕★◈★✿、ChatGPT★◈★✿、DeepSeek等智能涌现★◈★✿,我们该如何触发AI时代其他的突破性技术涌现?这些技术又该怎样反哺产业升级?

  本书阐述了人工智能技术演变的大趋势★◈★✿、算力驱动计算体系的突破★◈★✿,以及人工智能如何赋能生命科学★◈★✿、物联网★◈★✿、自动驾驶等★◈★✿。这些领域蕴含着巨大的商业空间和发展机遇必发★◈★✿,人工智能在探索过程中将发挥决定性和颠覆性的作用必发★◈★✿,相关研发成果在实用化织品服装★◈★✿。★◈★✿、普及化之后将产生可观的社会效益★◈★✿。本书也系统分析了人工智能飞速发展背后的问题和风险★◈★✿,以及国内外政府★◈★✿、企业★◈★✿、科研界的应对措施等★◈★✿。

  最后★◈★✿,本书展望了整个行业未来的技术发展趋势和创新路径★◈★✿,中国在其中的机遇和挑战★◈★✿,产学研各界在第四次工业革命中的角色分工和承担的责任★◈★✿,AI时代的人才培养与全球科技交流★◈★✿,等等★◈★✿。


必发·bifa(中国集团)唯一官方网站| http://www.xjzmd.net