官方网站-首页官方网站-首页

新闻中心

NEWS CENTER

新闻中心 媒体报道 人民智造2- 沉浸式媒体技术,视觉感知计算的交响

人民智造2- 沉浸式媒体技术,视觉感知计算的交响

发布时间:2025-10-17 18:00:14

阅读量:259次

【导语】来自北京大学王选计算机研究所的贾川民研究员,为我们揭开“沉浸式媒体”的神秘面纱:它融合VR/AR等技术,模糊虚实界限,带来多感官身临其境的体验。从内容制作到场景应用,沉浸式媒体正打破时空限制,让文物活化、古今对话成为现实,推动科技与文化的深度融合。

大家好,我是贾川民,来自北京大学王选计算机研究所,我是研究员和博士生导师。我主要的研究内容是多媒体智能计算,智能数据的压缩处理,以及一些系统化的工作。

什么是“沉浸式媒体”

“沉浸式媒体”究竟是什么,是旨在通过技术手段(VR/AR/MR/360视频/光场/全息等)模糊虚拟与现实的界限,为用户提供身临其境、多感官的体验,这里的多感官主要是视觉,我们在沉浸媒体计算当中,也包含听觉、触觉等内容,它最大的特点就是用户能够“身临其境”的感受这些沉浸式的内容,同时(shí)用(yòng)户(hù)很(hěn)难(nán)去(qù)分(fēn)辨(biàn)出(chū),看(kàn)到(dào)的(de)内(nèi)容(róng)究(jiū)竟(jìng)是(shì)真(zhēn)实(shí)的(de)还(hái)是(shì)虚(xū)拟(nǐ)创(chuàng)建(jiàn)出(chū)来(lái)的(de)。

举个例子,沉浸(jìn)式(shì)媒(méi)体(tǐ)就(jiù)像(xiàng)“交(jiāo)响(xiǎng)乐(lè)团(tuán)”组(zǔ)成(chéng)。乐(lè)团(tuán)的(de)“指(zhǐ)挥(huī)”和(hé)“乐(lè)谱(pǔ)识(shi)别(bié)”就(jiù)是(shì)计(jì)算(suàn)机(jī)视(shì)觉(jué)技(jì)术(shù),每(měi)个(gè)乐(lè)团(tuán)的(de)指(zhǐ)挥(huī)就(jiù)是(shì)整(zhěng)个(gè)乐(lè)团(tuán)的(de)“大(dà)脑(nǎo)”,那(nà)么(me)计算机视觉技术就是沉浸式媒体的核心技术。它负责把所见变为可演奏的音符;乐团里的“演奏家”,各个乐器的表演艺术家,就由不同领域的生成式人工智能模型来负责,演绎出华彩篇章;在沉浸式媒体计算里面,我们还会使用手势识别、语音交互、触觉反馈、空间音频这些技术,它们能够为用户提供自然地与虚拟世界互动;VR头盔、AR眼镜、全息投影、高分辨率大屏(píng)是(shì)表(biǎo)演(yǎn)的(de)“舞(wǔ)台(tái)”。

如(rú)何(hé)制(zhì)作(zuò)“沉(chén)浸(jìn)式(shì)媒(méi)体(tǐ)”内(nèi)容(róng)

那(nà)么(me)如(rú)何(hé)制(zhì)作(zuò)这(zhè)些(xiē)内(nèi)容(róng)呢(ne)?需(xū)要(yào)通(tōng)过(guò)硬(yìng)件(jiàn)集成(chéng)、软(ruǎn)件(jiàn)开(kāi)发(fā)平(píng)台(tái)、核(hé)心(xīn)技(jì)术(shù)算(suàn)法(fǎ)优(yōu)化(huà),最(zuì)后(hòu)是(shì)内(nèi)容(róng)创(chuàng)作(zuò),在(zài)目(mù)前(qián)的(de)内(nèi)容创作领域,大家通常都会采用低成本的沉浸式内容创作工具链,来整合相关的内容。

这样,就能够打破空间限制的进行虚拟旅游、实现真正的“人在画中游”,例如,走进博物馆,我们可以通过头戴式的VR设备实现360度观赏古代的山水画卷,比如《千里江山图》,比如《清明上河图》,这样非常巨幅的画卷,我们并不(bù)需(xū)要(yào)人(rén)走(zǒu)进博物馆当中就可以体验,在(VR)头盔当中,我们观察到的内容,还可以通过眼动追踪模块,抓取到不同用户感兴趣的区域,目之所及便是画卷内容的讲解,再通过AIGC技术和2D转3D技术把画卷中的花鸟鱼虫,人物形象进行立体化的呈现,让静态的画卷呈现栩栩如生的姿态;

我们还可以从头盔的约束中解放出来,走进沉浸式视觉体验空间。这个空间和教室一样大小,但四周和地面全都是显示屏幕,置身于此仿佛消除了地理空间的约束,通过全景映射和智能生成,这些显示屏幕能够将远处的风景,一比一的在空间中还原。而空间智能计算让体验者能够在这个空间中感受到飞跃祖国大好河山的新奇体验。

沉浸式媒体技术还能打破时间约束、实现与文物的古今对话和古迹活化展示,通过数字孪生、三维重建,静态的文物便可以化身可视化的三维模型,结合手势识别、姿态估计和驱动交互,便可以穿越古今在虚拟空间中进行文物鉴赏,学习文物背后的历史故事,通过虚拟数字人的互动讲解,了解文物历经千年的流转。这些形式,都是我们目前通过沉浸式媒体计算技术来实现的体验,这些体验极大地丰富了我们目前对(duì)于(yú)文物、对于文化、对于科技这三者进行融合的场景。以上就是关于沉浸式媒体计算相关的介绍。

本文为·创作培育计划扶持作品

作者:人民日报

审核:贾宁 大连东软信息学院 教授

出品:中国科协科普部

监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

来源: 创作培育计划


前一篇:人民智造2- 什么是“智慧城市”?AI如何让城市更聪明 返回列表 下一篇:人民智造2- 多模态数据智能压缩:从“一图胜千言”到“一图生千言”

相关新闻

中国“人造太阳”找到突破密度极限方法

2026-01-04

中国“人造太阳”找到突破密度极限方法

听歌时身体的一个小动作,揭穿了大脑的工作真相

2026-01-04

听歌时身体的一个小动作,揭穿了大脑的工作真相

向章鱼“取经”,科学家3D打印出能抓蛋黄的水凝胶抓手

2026-01-03

向章鱼“取经”,科学家3D打印出能抓蛋黄的水凝胶抓手

云平台应用案例

帮助企业低成本、高效率、专业化建立属于自己的工业互联网平台!

立即咨询