TCL发布7项AI项目，覆盖视频、语音处理和多模态等领域-电子发烧友网

2019 年 6 月 14 日，TCL 举办了以“技术无疆界，合作赢未来”为主题的技术合作开放大会。会上，TCL 面向全球发布了 13 项技术合作项目，其中包括 7 项人工智能技术项目。此外，大会当天 TCL 还宣布已聘请 29 名业界一流技术专家为技术顾问，帮助 TCL 开拓技术战略视野，洞察前沿技术趋势，提升技术创新能力，其中包括 CSDN 创始人&董事长，极客帮创投创始合伙人蒋涛。

发布7项AI项目，覆盖视频、语音处理和多模态等领域

谈到 TCL，大多数人的第一反应可能还是这家公司的电视或手机等产品，然而，在技术创新的驱动下，这家全球化的老牌企业已紧跟潮流，与当下发展最为迅猛地技术——人工智能紧密结合，定位已悄然变成一家全球化的智能产品制造及互联网应用服务企业集团。TCL 在美国、波兰、香港、西安、武汉和深圳等地设立的研发中心，早已将图像处理、语音处理等技术应用于手机、电视等产品中。

这次，TCL 在近日举行的技术合作开放大会上，将 AI技术的布局再次扩大，面向全球发布了 13 个技术合作项目，其中就包括 7 项人工智能技术，另外 6 项为新型显示技术。本文将重点介绍 AI 相关技术项目。

这 7 项 AI 项目覆盖图像、视频和语音处理、多模态等领域，具体详情如下：

视频处理类AI-IP

背景与需求：4K、8K屏技术已经成熟，目前4K、8K片源少，VOD视频流传输带宽也不足等；需要开发高性能图像处理IP。

研究内容：开发一种AI加速架构，支持4K/8K,最大120Hz视频处理；支持功能：超分/插帧/视频解码等人工智能算法；解决DDR和计算之间的瓶颈，解决大算力下，芯片功耗大的问题。

端到端的神经网络视频编解码框架及实现

背景与需求：视频压缩方法（H.265）有专利收费问题，4K/8K内容的出现，带宽需要大幅度提升。基于深度学习的端到端视频编解码框架，具有强大的视频压缩能力；需要开发AI编解码算法。

研究内容：计完整的视频编解码框架：实现关键帧的压缩算法；实现运动估计及非关键帧的压缩；实现视频解码后处理，对解码视频进行增强。

内存计算研究(模拟计算或者围绕新型存储计算)

背景与需求：AI视频处理：最大的挑战是算力要求高，芯片面积大，功耗大。冯诺伊曼架构（存储和计算分离），面临瓶颈；需要研究新型的AI加速结构。

研究内容：围绕IC新工艺（例如MRAM,RRAM等工艺），探索存算一体，模拟计算等技术，提高模拟计算的精度，算力和功耗等问题，以达到应用水平；积极探索适合于内存计算的新架构。

图像处理类AI算法的加速方法

背景与需求：8K/120Hz显示器件的出现，图像处理芯片面临很大的挑战（算力，功耗和面积）；探索新的算法结构和加速计算方法。

研究内容：针对视频超分，视频插帧类算法，从算法模型和AI硬件架构方面，探索新的加速运算方法：轻量化的AI算法模型设计；利用图像空间相关性，进行智能快速计算的方法等。

语言：生成式闲聊（NLP）

背景与需求：目前闲聊系统，大多是用海量语料对，对seq2seq网络进行训练而成，此类系统对话水平和真人对话相去甚远；开发具备有主题/前后文关联及回忆能力的对话系统。

研究内容：能记忆和理解用户聊天内容和过程的对话机器人，在对话过程中，能体现上下文，并可以自由转换话题；对话范围：家电领域使用

面向用户审美的图像评价数据库

图片的审美评价是一个重要指标；我们需要建立一个主观评价数据库，训练一个机器自主评价的系统。

开发无参考图像评价数据库框架和采集方案；设计深度学习算法模型学习用户审美趋势；设计并开发图像评价软件管理系统。

电视/物联网设备多模态交互研究

背景与需求：目前电视逐步具有听/说/看以及接入其他物联网设备的能力，但是交互方式单一；构建多模态交互系统。

研究内容：摄像头：分析用户的行为：肢体，表情等；Mic：分析声纹，韵律，情绪等；手机等其他用户行为数据；其他可能的传感器数据；综合各种数据，开发各种自然的交互场景。

量子点材料智能合成系统

背景与需求：QLED材料离产业化还有一定的距离（发光效率和寿命），材料合成试验费时费力；开发一种自动化材料合成试验系统。

研究内容：搭建微流控反应系统（合成材料）；搭建强化学习网络，为合成高性能新材料探索最优实验路径，获得理想材料合成参数。

在人工智能技术领域，TCL 早已有所布局，分别在美国、波兰、香港、西安、武汉和深圳等地设立研发中心，在图像、语音语义技术等领域开展了大量的技术工作，并应用于手机、电视产品中；在语音、语义和图像领域构建了大量自有数据，已建立了 25 个大类垂直领域数据集。

通过这些处于技术前沿的项目，TCL 希望可以引进全球顶尖的技术资源，解决重大、前瞻性的技术难题，实现共赢。TCL 会为合作者提供充足的研发经费，并重奖有突出贡献的项目，针对有重大突破的技术可以进行 IP 合作。

另外，TCL 还可以提供优良的研发条件：在人工智能技术方面，可以提供垂直领域独有的高质量数据、算法和落地的应用场景。

在新型显示技术方面，可以提供国际一流的实验平台、上下游产业的验证环境和配套技术，还可以提供优秀的技术团队配合开展工作，以及提供高质量、舒适的生活配套资源。

在新型显示领域，TCL 分别在深圳、广州和武汉设立研发中心，拥有一支研发队伍。

创办港大-TCL 人工智能联合研究院，聘请29名技术顾问

大会当天，TCL 还与香港大学签订建立港大-TCL 人工智能联合研究院协议，并与中科院苏州纳米所、高校和企业签订了 7 个合作项目，希望能和更多的国内外顶尖高校、企业建立良好的合作关系。

此外，TCL 还宣布聘请了 29 名业界顶级技术专家为技术顾问，和他们开展合作，其中，CSDN创始人&董事长，极客帮创投创始合伙人蒋涛也作为技术专家被邀请参会。

与中美贸易相互封锁的态度不同，TCL 依然保持这对外开放的姿态，蒋涛在会间采访中也表达了自己对于技术开放的理解：“从战略和实际的角度，我们可能都需要建设一套自己的研发、评价和科技和开源体系，所以反过来这会带来一些机会。开放技术大会其实就是一种很好的模式，通过开放、开源来推进整个行业的进步。”

预计未来3年，TCL 还将聘请 100 名业内顶尖技术专家作为技术顾问，助力开拓技术视野，洞察前沿技术趋势。此外，作为全球技术合作战略之一，TCL 还将筹建国家新型显示技术创新中心。目前，TCL 已聚集 30 所研究型大学，12 个国家重点实验室及多家科研院所和近 100 家上下游企业。

作为一家全球化的智能产品制造及互联网应用服务企业集团，TCL 十分重视产品技术能力，2018 年，TCL 研发投入 56 亿元，拥有 12000 多名研发技术人员。截止 2019 年 5 月，TCL 全球专利申请量为 61234 件，其中国内 39011 件，申请国外专利 11067 件，另有 11156 件的 PCT 国际专利申请。特别值得一提的是，根据对全球量子点已公开专利的调查，TCL 在量子点电致发光领域的公开专利数量为 822 件，居全球第二名，仅次于三星。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

TCL

TCL

+关注

关注
10

文章
1721

浏览量
88552
语音处理

语音处理

+关注

关注
3

文章
43

浏览量
19310
ai技术

ai技术

+关注

关注
1

文章
1266

浏览量
24278

原文标题：TCL发布7项AI合作项目，聘任蒋涛为技术顾问

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

利用OpenVINO部署Qwen2多模态模型

多模态大模型的核心思想是将不同媒体数据（如文本、图像、音频和视频等）进行融合，通过学习不同模态之间的关联，实现更加智能化的信息

发表于 10-18 09:39 •407次阅读

Meta发布多模态LLAMA 3.2人工智能模型

Meta Platforms近日宣布了一项重要技术突破，成功推出了多模态LLAMA 3.2人工智能模型。这一创新模型不仅能够深度解析文本信息，还实现了对图像内容的精准理解，标志着Meta在AI

发表于 09-27 11:44 •394次阅读

依图多模态大模型伙伴CTO精研班圆满举办

大模型在不同行业领域的应用前景;7月19日， “依图科技多模态大模型伙伴CTO精研班”在杭州圆满举办，让更多的伙伴们深度体验了依图多

发表于 07-23 15:16 •410次阅读

Meta不会在欧盟提供新的多模态AI模型

科技巨头Meta近日宣布了一项重要决策，其即将推出的创新多模态Llama模型将不会在欧盟地区发布。这一决定背后，是Meta对欧洲复杂且不可预测的监管环境的深刻考量，也为Meta与欧盟监

发表于 07-19 16:04 •479次阅读

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

丰富外设配件配套多模态应用示例，支持快速上手体验大模型语音交互、智能视觉等 AI 应用板载 DAPLINK 调试器，外接一条USB 线即

发表于 06-18 17:33

智谱AI发布全新多模态开源模型GLM-4-9B

近日，智谱AI在人工智能领域取得重大突破，成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力，再次刷新了业界对于大型语言模型的认识。

发表于 06-07 09:17 •723次阅读

Build 2024发布多项Azure AI Speech全新多模态功能

客户们持续使用 Azure OpenAI 和 Azure AI Speech 进行创新，为企业引入新的效率，并构建新的多模态体验。

发表于 05-28 09:08 •562次阅读

谷歌发布多模态AI新品，加剧AI巨头竞争

在全球AI竞技场上，谷歌与OpenAI一直稳居领先地位。近日，谷歌在I/O开发者大会上掀起了一股新的技术浪潮，发布了多款全新升级的多模态AI

发表于 05-16 09:28 •442次阅读

李未可科技正式推出WAKE-AI多模态AI大模型

李未可科技多模态 AI 大模型正式发布，积极推进 AI 在终端的场景应用 4月18日，2024中国生成式

发表于 04-18 17:01 •581次阅读

谷歌推出多模态VLOGGER AI

谷歌最新推出的VLOGGER AI技术引起了广泛关注，这项创新的多模态模型能够让静态肖像图“活”起来并“说话”。用户只需提供一张人物肖像照片和一段音频内容，VLOGGER AI就能让图

发表于 03-22 10:45 •827次阅读

MWC2024：高通推出全新AI Hub及前沿多模态大模型

2024年世界移动通信大会（MWC）上，高通再次展现其技术领导力，通过发布全新的高通AI Hub和展示前沿的多模态大模型技术，推动了5G和AI

发表于 02-26 16:59 •1249次阅读

【有奖】百度智能云度目推出首款多模态 AI 模组，应用场景有奖征集！

具备AI图文理解、语音唤醒、智能多轮对话等能力数据处理能力强大，分析速度快，二次开发高度集成易用点击

发表于 02-26 15:19 •535次阅读

Sora爆红，多模态大模型是下一发展阶段

“大语言模型为 AI 产业带来新的生机，然而语言模型的应用场景有限。要全面打开生成式 AI 的想象力，还是要依托多模态大模型。”IDC 中国研究总监卢言霞近日表示。Sora在文生

发表于 02-20 16:13 •434次阅读

自动驾驶和多模态大语言模型的发展历程

多模态大语言模型(MLLM) 最近引起了广泛的关注，其将 LLM 的推理能力与图像、视频和音频数据相结合，通过多模态对齐使它们能够更高效地执行各种任务，包括图像分类、将文本与相应的

发表于 12-28 11:45 •517次阅读

语音识别技术最新进展：视听融合的多模态交互成为主要演进方向

电子发烧友网报道（文/李弯弯）所谓“模态”，英文是modality，用通俗的话说，就是“感官”，多模态即将多种感官融合。多模态交互技术是近年

发表于 12-28 09:06 •3806次阅读