0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能感知与物联网技术研究所

文章:411 被阅读:167.5w 粉丝数:22 关注数:0 点赞数:11

广告

准确性超Moshi和GLM-4-Voice,端到端语音双工模型Freeze-Omni

GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现端....
的头像 智能感知与物联网技术研究所 发表于 12-17 10:21 135次阅读
准确性超Moshi和GLM-4-Voice,端到端语音双工模型Freeze-Omni

CNN, RNN, GNN和Transformer模型的统一表示和泛化误差理论分析

背景介绍 本文是基于我们之前的 RPN(Reconciled Polynomial Network)....
的头像 智能感知与物联网技术研究所 发表于 12-06 11:31 178次阅读
CNN, RNN, GNN和Transformer模型的统一表示和泛化误差理论分析

复旦提出大模型推理新思路:Two-Player架构打破自我反思瓶颈

在 AI 领域,近期的新闻焦点无疑是关于「Scaling Law 是否撞墙?」的辩论。这一曾经被视作....
的头像 智能感知与物联网技术研究所 发表于 12-06 11:24 154次阅读
复旦提出大模型推理新思路:Two-Player架构打破自我反思瓶颈

浙大、微信提出精确反演采样器新范式,彻底解决扩散模型反演问题

随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐....
的头像 智能感知与物联网技术研究所 发表于 11-27 09:21 163次阅读
浙大、微信提出精确反演采样器新范式,彻底解决扩散模型反演问题

经典图神经网络(GNNs)的基准分析研究

本文简要介绍了经典图神经网络(GNNs)的基准分析研究,发表在 NeurIPS 2024。 文章回顾....
的头像 智能感知与物联网技术研究所 发表于 11-27 09:16 170次阅读
经典图神经网络(GNNs)的基准分析研究

一种信息引导的量化后LLM微调新算法IR-QLoRA

大模型应用开卷,连一向保守的苹果,都已释放出发展端侧大模型的信号。 问题是,大语言模型(LLM)卓越....
的头像 智能感知与物联网技术研究所 发表于 11-19 17:16 286次阅读
一种信息引导的量化后LLM微调新算法IR-QLoRA

适配器微调在推荐任务中的几个关键因素

可迁移的推荐系统 (TransRec) 通常包含一个用户编码器和一个或多个基于模态的物品编码器,其中....
的头像 智能感知与物联网技术研究所 发表于 03-04 09:50 594次阅读
适配器微调在推荐任务中的几个关键因素

再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:40 533次阅读
再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!

想将一份文档图片转换成 Markdown 格式?以往这一任务需要文本识别、布局检测和排序、公式表格处....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:40 1843次阅读
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!

NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界

在这篇 NeurIPS23 论文中,来自鲁汶大学、新加坡国立大学和中科院自动化所的研究者提出了一种视....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:35 527次阅读
NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界

ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

这篇是 ICLR 上用 TCN 来做一般的时间序列分析的论文,在 Rebuttal 之后的分数为 8....
的头像 智能感知与物联网技术研究所 发表于 12-18 16:05 875次阅读
ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

除了模仿人类说话、写作、写代码,大模型还能用来发现新知识。 作为今年 AI 圈的顶流,大型语言模型(....
的头像 智能感知与物联网技术研究所 发表于 12-18 15:55 302次阅读

GPT推断中的批处理(Batching)效应简析

机器学习模型依赖于批处理(Batching)来提高推断吞吐量,尤其是对于 ResNet 和 Dens....
的头像 智能感知与物联网技术研究所 发表于 12-18 15:52 710次阅读
GPT推断中的批处理(Batching)效应简析

拆解大语言模型RLHF中的PPO算法

由于本文以大语言模型 RLHF 的 PPO 算法为主,所以希望你在阅读前先弄明白大语言模型 RLHF....
的头像 智能感知与物联网技术研究所 发表于 12-11 18:30 2240次阅读
拆解大语言模型RLHF中的PPO算法

大规模神经网络优化:超参最佳实践与规模律

从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的超参数选择。反过来,实践中的超参数选择也....
的头像 智能感知与物联网技术研究所 发表于 12-10 21:45 1007次阅读

陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中 ....
的头像 智能感知与物联网技术研究所 发表于 12-10 21:45 783次阅读
陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎

2023年11月18日CCF YOCSEF太原在太原理工大学明向校区信计学院北楼一层会议室举办“卫星....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:25 1254次阅读
星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎

任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。 今年 5 月,北卡罗....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:20 689次阅读
任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

论文链接:  https://arxiv.org/abs/2305.10299 代码链接1: htt....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:20 658次阅读
NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

AI Agents 是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的 LLM Agen....
的头像 智能感知与物联网技术研究所 发表于 11-26 21:25 994次阅读
NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%

本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,....
的头像 智能感知与物联网技术研究所 发表于 11-20 09:15 591次阅读
全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%

13B模型全方位碾压GPT-4?这背后有什么猫腻

你的测试集信息在训练集中泄漏了吗? 一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图....
的头像 智能感知与物联网技术研究所 发表于 11-20 09:15 537次阅读

把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架

作为本年度人工智能领域最重要的突破之一,大语言模型相关研究始终是各大相关领域的关注焦点。 近日,来自....
的头像 智能感知与物联网技术研究所 发表于 11-20 09:10 635次阅读
把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架

NeurIPS 2023 | 北大具身智能团队提出需求驱动导航:对齐人类需求,让机器人更高效

如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑....
的头像 智能感知与物联网技术研究所 发表于 11-12 22:05 523次阅读

Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了

网友:我都不敢想 象一年后的视频技术会有多先进。 一段五十秒的预告视频,再次让 AI 圈沸腾了。 昨....
的头像 智能感知与物联网技术研究所 发表于 11-12 22:00 1004次阅读
Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了

从ID-based到LLM-based:可迁移推荐系统发展

Paper List:  https://github.com/westlake-repl/Reco....
的头像 智能感知与物联网技术研究所 发表于 11-12 22:00 710次阅读
从ID-based到LLM-based:可迁移推荐系统发展

重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了

Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序 列中的多层次表....
的头像 智能感知与物联网技术研究所 发表于 11-05 20:15 537次阅读
重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了

178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离

上海交大上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性....
的头像 智能感知与物联网技术研究所 发表于 11-05 20:15 580次阅读
178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离

NeurIPS 2023 | 如何从理论上研究生成式数据增强的效果?

论文链接: https://arxiv.org/abs/2305.17476 代码链接: https....
的头像 智能感知与物联网技术研究所 发表于 11-05 20:15 655次阅读
NeurIPS 2023 | 如何从理论上研究生成式数据增强的效果?

NeurIPS 2023 | 大模型时代自监督预训练的隐性长尾偏见

离开学校加入公司的业务部门已经半年多了,往后应该会努力抽时间做点开源项目,但暂时没什么计划再发一作论....
的头像 智能感知与物联网技术研究所 发表于 10-30 11:05 458次阅读
NeurIPS 2023 | 大模型时代自监督预训练的隐性长尾偏见