-
内容大纲
本书汇集了张勤及其团队在智能音视频处理领域近年来的研究成果及前瞻性思考,涵盖情智信息、媒介音频、视觉处理和人工智能四个部分。情智信息部分探讨了情感计算在智能系统中的应用,包括EEG情感识别、音乐情感质量评估等多个方面;媒介音频部分展现了如何通过智能技术,在音乐创作、音频处理等领域开辟新的可能性;视觉处理部分通过3D重建、人体姿态估计等领域的重要突破,展示了智能技术在空间感知和虚拟现实等方面的应用潜力;人工智能部分聚焦神经网络模型的创新与优化,指出了人工智能在模型理解和优化中的新方向。
本书不仅汇集了作者及其团队在智能音视频领域的理论探索和实际应用成果,也能够激发更多关于智能音视频技术未来发展的思考与讨论。 -
作者介绍
张勤,中国传媒大学教授、博士生导师,媒介音视频教育部重点实验室主任。主要研究领域为智能视音频处理、情智信息理论与应用。取得多项系统性创新成果,自主研发了国际领先的96声道DMS声场重建系统,在分级服务、语音控制、声场综合与动态响应4个主要技术层面突破了杜比与DTS系统;创新性地提出了“情智信息理论”,该理论在激发情感影响智能方向独树一帜,有助于真正实现类人智能、类脑智能。主持与完成国家自然科学基金重点和面上项目、国家科技攻关重大项目、国家广播电视总局科技项目、教育部科学技术重点项目等20余项,发表学术论文百余篇,获国家发明专利授权10余项。 -
目录
第一部分 情智信息
情智信息的建模与应用
Interaction Between Dynamic Aff ection and Arithmetic Cognitive Ability:a Practical
Investigation with EEG Measurement
SSTM-IS:Simplifi ed STM Method Based on Instance Selection for Real-Time EEG
Emotion Recognition
Multi-Source Information-Shared Domain Adaptation for EEG Emotion Recognition
Emotional Quality Evaluation for Generated Music Based on Emotion Recognition
Model
第二部分 媒介音频
Design of Linear-Phase Nonsubsampled Nonuniform Directional Filter Bank with
Arbitrary Directional Partitioning
Multi-Source Separation Using over Iterative Empirical Mode Decomposition
A Two-Stage Complex Network Using Cycle-Consistent Generative Adversarial Networks for Speech Enhancement
Analysis of Music Rhythm Based on Bayesian Theory
Learning to Generate Emotional Music Correlated with Music Structure Features
Visually Aligned Sound Generation via Sound-Producing Motion Parsing
MovieREP:a New Movie Reproduction Framework for Film Soundtrack
第三部分 视觉处理
Distributed Markov Chain Monte Carlo Kernel Based Particle Filtering for Object Tracking
Use Hierarchical Genetic Particle Filter to Figure Articulated Human Tracking
Human Action Recognition Using Multi-Velocity STIPs and Motion Energy Orientation Histogram
Semantic Based Autoencoder-Attention 3D Reconstruction Network
Flexible Light Field Angular Superresolution via a Deep Coarse-to-Fine Framework
Cross-Domain Feature Similarity Guided Blind Image Quality Assessment
A Dataset and Benchmark for 3D Scene Plausibility Assessment
第四部分 人工智能
Interpretability Diversity for Decision-Tree-Initialized Dendritic Neuron Model Ensemble
Pruning of Dendritic Neuron Model with Signifi cance Constraints for Classifi cation
A General Paradigm of Knowledge-Driven and Data-Driven Fusion
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...