NEWScoreFlow:一种自动化多智能体工作流生成和优化方法
ScoreFlow是一种自动化多智能体工作流生成与优化方法,它通过基于梯度的连续空间优化技术,结合Score-DPO,不断改进协作流程,从而提升模型性能。
2025-04-10 13:38:58人气:1497℃
NEWPDF-Craft:一个扫描书籍PDF文件转Markdown/EPUB工具
PDF-Craft是一个用于处理PDF文件的开源项目,专注于将扫描书籍的PDF转换为Markdown或EPUB格式。
2025-04-10 13:34:03人气:239℃
NEWBrowserAgent:一款基于浏览器的AI自动化工具,无需编写代码即可创建AI工作流。
Browseragent 是一款基于浏览器的AI自动化工具,无需编写代码即可创建自定义 AI 工作流。它利用浏览器 GPU 运行 AI 模型,完全本地处理数据,确保隐私且无需支付 API 费用。
2025-04-10 13:29:04人气:1931℃
NEWMoshiVis:一款能听还能看,并用流畅的语音跟你讨论图像内容的视觉语音模型
MoshiVis 是一个在Moshi基础上开发的一款视觉语音模型,能够以自然对话风格讨论图像内容。支持多轮对话,可以描述图片的文字内容并回答有关于图片的问题。
2025-04-10 13:24:04人气:1658℃
NEWQwen2.5-Omni:阿里巴巴发布的端到端全能多模态旗舰模型
Qwen2 5-Omni 是阿里巴巴发布的新一代端到端多模态旗舰模型,可以理解文本、音频、图像、视频,可以同时进行思考和说话,并通过实时流式响应同时生成文本与自然语音合成输出。
2025-04-10 13:19:07人气:849℃
NEWMureka O1:昆仑万维发布的全球首款音乐推理大模型
Mureka O1是昆仑万维发布的全球首款音乐推理大模型。它采用思维链技术,通过多轮推理和结构化生成,能够创作高质量音乐作品。
2025-04-10 13:14:13人气:458℃
NEWFigma Context MCP:实现设计到代码的高效转换
一个MCP服务器工具,它通过传递 Figma 设计文件的布局信息给 AI 编码工具(如 Cursor),从而实现设计到代码的高效转换,提升开发效率和准确性。
2025-04-10 12:15:13人气:1413℃
NEWCangjie Magic:基于华为仓颉编程语言原生构建的LLM Agent开发平台
Cangjie Magic 是由华为仓颉社区推出的 Agent(智能体)开发框架。它是首个基于仓颉编程语言原生构建的 LLM Agent 开发平台。
2025-04-10 12:10:22人气:1542℃
NEWReasonGraph:一款将LLM推理过程可视化的开源项目
ReasonGraph是一款LLM推理过程可视化工具,支持实时更新和交互式分析,它会把AI的思考过程生成可视化图表,生成的图表可以一键导出SVG格式。
2025-04-10 12:05:29人气:1438℃
NEWOpen-Sora 2.0 和 OpenAI Sora的特点与区别
Open-Sora 2 0 是由潞晨科技推出的最新开源 AI 视频生成模型,具有高性能、低成本和全面开源的特点,OpenAI Sora 则能够根据文本描述生成高质量的动态视频。最新版本是 Sora Turbo,两者相比有什么不同呢。
2025-04-10 12:00:32人气:623℃
NEWDify、Fastgpt和Ragflow三个平台有什么区别?如何选择?
Dify、FastGPT和Ragflow都以大语言模型为基础,通过借助LLM的强大语言理解和生成能力,为用户提供智能问答、内容生成等功能,下面我们就来对比一下,他们有什么区别以及如何选择一个适合自已的平台。
2025-04-10 11:55:42人气:1334℃
NEWReCamMaster:一种从单个视频生成新视角和运动轨迹视频的框架
ReCamMaster是一种从单个视频生成新视角和运动轨迹视频的框架,由浙江大学、快手科技等机构提出。它通过预训练的视频生成模型和创新的视频条件机制,实现高质量的视频重渲染。
2025-04-10 11:50:50人气:1464℃
NEWTxAgent:用于治疗推理和个性化药物治疗方案制定的AI智能体
TxAgent 是由哈佛医学院开发的一款用于治疗推理和个性化药物治疗方案制定的AI智能体。
2025-04-10 11:45:55人气:1818℃
NEWMistral AI发布Mistral Small 3.1:支持多模态、多语言、128K上下文窗口
Mistral Small 3 1 是Mistral AI最新发布的一款开源的多模态、多语言 AI 模型,支持长达128k的上下文窗口,推理速度达每秒150个标记,性能超越同类模型。
2025-04-10 11:41:00人气:731℃
NEWCodeGeeX安装、部署、配置和使用教程
CodeGeeX 是一款免费的AI编程助手,支持多种编程语言,能够帮助开发者快速生成代码、修复错误、翻译代码等。以下为你介绍CodeGeeX的安装、部署、配置和使用教程。
2025-04-10 11:36:09人气:1302℃
NEW秘塔AI搜索生成互动网页功能怎么用?
秘塔AI搜索上线了“生成互动网页”功能。用户可以在研究模式下将文字内容或文章链接快速转化为可视化网页。方法如下:
2025-04-10 11:31:18人气:1614℃
NEWLangManus:社区驱动的AI自动化框架,多智能体协作完成复杂任务
LangManus 是一个社区驱动的 AI 自动化框架,基于分层多智能体系统设计。它旨在将语言模型与专业工具(如网络搜索、爬虫和 Python 代码执行)相结合,以完成复杂任务。
2025-04-10 11:26:18人气:583℃
NEW腾讯Hunyuan3D-2推出的5个开源3D模型,各自特点是什么?
Hunyuan3D 2是腾讯推出的j一款先进的大规模 3D 资产生成系统,能够从文本或图像生成高分辨率且带有纹理的 3D 模型。
2025-04-10 11:21:19人气:330℃
NEW博思白板引领智能化创作时代,推出强大的AI创作能力
博思白板最近上线了一个重磅功能「Al助手」,可以像使用 ChatGPT 一样,在博思白板中向它提出各种问题,同时将生成的内容直接添加到白板中,提升内容创作效率,智能化创作不在遥远。
2025-04-10 11:16:49人气:1802℃
NEWSkywork R1V:昆仑万维开源的全球首个工业级开源多模态推理模型
Skywork R1V是什么?Skywork R1V 是由昆仑万维开源的一款多模态思维链推理模型,于2025年3月18日正式发布。Skywork R1V 是全球
2025-04-10 11:16:21人气:1250℃
NEWplaywright-mcp:能够使大语言模型直接操控浏览器完成复杂任务
laywright-MCP 是一个结合了 Playwright 的跨浏览器能力和模型上下文协议的开源工具,能够直接操控浏览器完成复杂任务,可以用来自动填写网页表单、自动收集网页信息、自动进行网页测试等。
2025-04-10 11:11:22人气:1085℃
NEWGitHub加持Copilot能力后超强进化!让GPT-4为你自动写代码
GitHub 刚刚宣布了 Copilot X 计划,正式接入 GPT-4,并放出了一系列全新功能。Copilot X 搭建了一种以代码为中心的聊天模式。升级后的 Copilot 在整个开发生命周期中均可应用,而不仅仅是代码补全。
2025-04-10 11:10:47人气:785℃
NEW如何用OpenAI的GPT-4o来制作属于自己的表情包教程
想做表情包,办法有不少。今儿就说说如何用 OpenAI 的 GPT 4o 图像生成模型来搞出属于你自己的表情包,具体如何操作,接着往下看:
2025-04-10 11:06:24人气:136℃
NEWNotion AI使用初体验:ChatGPT文本生成的平替之作
随着ChatGPT一大波账号被封号和禁用,一些平替方案出现在大家跟前。今天就评测一下Notion AI这个软件。这个软件最大的好处是不需要翻墙,就可以直接使用。对于新手小白来说,非常友好。
2025-04-10 11:02:50人气:1097℃