Skip to content

Conversation

ZhijunLStudio
Copy link
Contributor

本教程提交一个基于文心ERNIE 4.5的、端到端的自动化视频舆情分析项目。

该系统通过多智能体协作,能自动处理线上评测视频,利用ERNIE 4.5 VL模型/百度智能云语音识别,实现对视频画面与语音的深度多模态理解。随后,探索、分析、策略三个智能体接力合作,对提取的信息进行推理与归纳,最终全自动生成一份包含量化数据和深度洞察的专业Markdown报告。

@paddle-bot
Copy link

paddle-bot bot commented Aug 22, 2025

你的PR提交成功,感谢你对开源项目的贡献!
请检查PR提交格式和内容是否完备,具体请参考示例模版
Your PR has been submitted. Thanks for your contribution!
Please check its format and content. For this, you can refer to Template and Demo.

@ZhijunLStudio ZhijunLStudio changed the title 【Hackathon 9th ERNIE Tutorial No.2】基于ERNIE 4.5的多智能体协作的自动化视频舆情分析报告生成器 【Hackathon 9th ERNIE Tutorial No.1】基于ERNIE 4.5的多智能体协作的自动化视频舆情分析报告生成器 Aug 22, 2025
Copy link
Collaborator

@jzhang533 jzhang533 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

试过直接用一个 prompt 就生成最终的分析报告吗?
对于要强行分成三次调用模型,感到有些困惑。

@ZhijunLStudio
Copy link
Contributor Author

试过直接用一个 prompt 就生成最终的分析报告吗? 对于要强行分成三次调用模型,感到有些困惑。

对于我的经验来说,单步跑测可以完成市面上的大多数任务,但是并不一定是一个完美的回答。

下面是我对于这个任务做了单步和三步的实验结论:

单步生成的报告虽然结构工整,但洞察力相对较浅,它更像是在填充一个预设的模板,有时为了满足指令,甚至会给出像“70%”、“80%”这样看似专业却缺乏事实依据的伪量化数据。而多步生成的报告则要深刻得多,它的观点有据可依,因为它能抓住市场的真实情绪,并引用像“智商税”、“杂牌货”这样极具冲击力的用户“金句”作为证据,让报告充满了真实的洞察力。

这引出了两者在可信度上的根本不同。单步模式为了完成任务,有时会走“捷径”,即当它无法真正执行某项指令(如精确的统计计算)时,便会“编造”一个看似合理的结果。而多步模式通过任务分解,有效地避免了这个问题。它的每一步都建立在可验证的事实之上,整个分析的逻辑链条清晰可见,因此其最终产出的报告也远比前者更加可靠和值得信赖。

@jzhang533
Copy link
Collaborator

这篇 tutorial 定位成用多智能体协作来进行新款汽车的市场舆情分析,给我的感觉是噱头大于实质。是不是可以改成简单的,介绍如何用 ERNIE-4.5-VL 模型进行自动视频分析的 tutorial ? 找几个 case 能够说明模型的理解能力。为了展示理解能力的效果,比如说可以给某个视频,生成一个简单的网站。或者做一个能够从摄像头里读视频流的示例,让模型可以解释视频流里的内容。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Projects

None yet

Development

Successfully merging this pull request may close these issues.

4 participants