NEWDreamActor-M1:字节跳动推出的一张人物照片替换到一段动作视频里的框架
DreamActor-M1是字节跳动推出的一款基于扩散变换器的人类图像动画框架,给定一张参考图像, 可以模仿从视频中捕捉到的人类行为,制作多个尺度的高逼真视频。
2025-04-10 15:37:04人气:793℃
NEWRunway Act One:将角色参考图像或视频快速转化为虚拟角色动画视频
Runway Act One 是一款AI 生成式角色表演工具,它能够将角色参考图像转换为虚拟角色动画,支持不同比例、不同风格的虚拟角色。
2025-04-10 15:32:13人气:1079℃
NEWEmbodied-Reasoner:浙江大学和阿里巴巴达摩院等机构联合提出的一个开源的多模态具身模型
Embodied-Reasoner是什么?Embodied-Reasoner是由中科院软件所、浙江大学和阿里巴巴达摩院等机构联合提出的一个开源的多模态具身模型。
2025-04-10 15:27:19人气:1211℃
NEWSkyReels-A2:昆仑万维出的一个任意视觉元素组装成合成视频的生成模型
SkyReels-A2是什么?SkyReels-A2 是由 Skywork AI 和昆仑万维联合开发的一个可控视频生成框架,能够根据文本提示将任意视觉元素(如人
2025-04-10 15:22:24人气:1792℃
NEWMidJourney V7新增功能及与MidJourney V6对比
MidJourney V7已于2025年4月4日发布,目前处于Alpha测试阶段,它新增了哪些功能呢,和V6相比,有哪些提升,下面我们介绍一下。
2025-04-10 15:17:27人气:125℃
NEWMidJourney V7的草稿模式(Draft Mode)是什么?
MidJourney V7的草稿模式是一种高效创作功能,渲染速度是标准模式的10倍,成本减半。它支持对话式交互,用户可通过语音或文字指令实时编辑图像。
2025-04-10 15:12:29人气:1294℃
NEW如何使用腾讯元器创建AI智能体教程指南
我们以做一个简单的天气查询助手为例,学会如何用腾讯元器一步步来创建一个天气查询AI智能体的教程。
2025-04-10 15:07:30人气:1398℃
NEWServerless-Qrcode-Hub:生成永久二维码,解决微信群聊二维码频繁变动的问题
Serverless-Qrcode-Hub是一个无需服务器的永久二维码生成工具,可以解决微信群聊二维码频繁变动的问题,它基于 Cloudflare Workers 和 D1 实现,支持自定义二维码样式和 Logo 以及自定义域名。
2025-04-10 15:02:32人气:1839℃
NEWAbletonMCP:能调用Ableton的MCP服务,让Claude也能够创作音乐的第三方集成工具。
AbletonMCP是一个第三方集成工具,可以通过自然语言与 AI 模型(如 Claude AI)交互,从而直接控制 Ableton Live 的功能,支持音乐制作、轨道创建和会话操作等功能。
2025-04-10 14:57:40人气:1797℃
NEWMCP、RAG、Agent是什么,它们之间有什么区别和关系
AI慢慢融入我们的学习、生活和工作之中,在AI这背后,有三个重要概念—MCP、RAG和Agent,它们组成了现代智能系统的核心架构。本文会深入研究这三个概念的含义、相互关系,以及它们怎样协同工作,从而让AI应用更强大、更高效。
2025-04-10 14:52:47人气:1852℃
NEW老师专用DeepSeek备课指令
新手老师每次备课,熬夜到凌晨3点,很辛苦是不是,如果老师们学会用deepseek指令来进行备课,那就方便多了,下面为你总结与备课有关的deepseek指令。
2025-04-10 14:47:57人气:1028℃
NEW分享7款真正免费的在线视频去水印网站
在进行视频编辑过程中,辛辛苦苦在网上找到一个超棒的视频素材,结果一看,上面有个大大的水印,瞬间就让人没了心情。不过别担心,我找到了几款超好用的免费在线视频去水印网站,今天就来给大家分享一下!
2025-04-10 14:43:06人气:287℃
NEWCodeSnap:一款高颜值代码截图工具
CodeSnap 是一个用纯 Rust 编写的工具,专门用于生成美观的代码截图。它提供了命令行界面和库的形式,可通过一行命令生成代码截图,支持 PNG、SVG 和 HTML 等输出格式。
2025-04-10 14:38:07人气:766℃
NEWAgenticSeek:本地版Manus,支持语音输入,可通过语音交互
AgenticSeek 是一个开源的、本地运行的 AI 助手,目标是成为 Manus AI 的替代品。它由 Deepseek R1 模型提供支持,完全在本地硬件上运行,无需依赖云端服务。
2025-04-10 14:33:13人气:855℃
NEWPiece it Together(PiT):将部分组件整合到一个完整的概念中,并生成缺失的部分。
Piece it Together(PiT)由特拉维夫大学和Bria AI的研究人员开发的一种创新的视觉概念生成框架,能够将用户提供的部分视觉组件无缝集成到一个连贯的整体概念中,并同时生成缺失的部分。
2025-04-10 14:28:22人气:983℃
NEWDeepSeek最新版本V3-0324更新了什么?
DeepSeek V3 在 2025年3月24日进行了小版本升级,版本号为V3-0324,而且也已经同步更新到官网上,使用的时候关闭深度思考就行了,下面是更新的内容:
2025-04-10 14:23:23人气:887℃
NEWTaoAvatar:阿里的一个高保真、轻量级的全身交互式数字人技术项目
TaoAvatar是一种高保真、轻量级的全身交互式数字人技术,基于3D高斯点绘制技术开发。它通过创建个性化的穿衣人类参数化模板,并将高斯点绑定到模板上以表示外观,从而实现逼真的全身数字人形象生成。
2025-04-10 14:18:32人气:111℃
NEW豆包本身如何生成PPT教程指南
豆包AI现在可以生成PPT了,在此之前,豆包本身并不直接支持生成PPT文件,它只要是通过与其他工具比如kimi、Gamma来结合来生成PPT文件,下面为你分享豆包本身如何生成PPT教程。
2025-04-10 14:13:39人气:1431℃
NEWDeepSeek+Gamma生成PPT教程全攻略
这份DeepSeek+Gamma生成PPT教程全攻略主要是给初学者和有一定基础的朋友们准备的,教大家怎么用 DeepSeek 和 Gamma app 快速做出专业级的演示PPT。
2025-04-10 14:08:39人气:256℃
NEWKDTalker:根据输入的音频信号生成逼真的面部表情和动作视频
KDTalker 是一个音频驱动动态肖像生成工具,能够根据输入的音频信号生成逼真的面部表情和动作,具有隐式关键点技术、时空扩散模型和姿势多样性等特点。
2025-04-10 14:03:39人气:1988℃
NEWGoogle推出Gemini 2.5 Pro:强大的推理能力,被描述为“最智能的 AI 模型”。
Google于2025年3月25日发布了最新的AI模型Gemini 2 5 Pro,这是其目前“最智能”的模型。具有强大的推理能力和多模态支持。
2025-04-10 13:58:47人气:949℃
NEWGemini 2.5 Pro与Gemini 2.5相比较,有哪些提升?
Gemini 2 5 Pro是谷歌最新发布的AI模型,相比Gemini 2 5,Gemini 2 5 Pro在推理、编码、多模态支持和上下文处理等方面都优于Gemini 2 5,是谷歌目前最智能的AI模型。
2025-04-10 13:53:48人气:1230℃
NEWOpenAI GPT-4o模型推出重大更新:为ChatGPT增加了图像生成和编辑功能
OpenAI于2025年3月25日正式宣布在GPT-4o模型中集成图像编辑和视觉生成功能,用户可以通过对话式来生成图像、修改现有视觉内容,甚至设计复杂的材料,如
2025-04-10 13:48:50人气:1651℃
NEWOpenAI推出的GPT-4o图像生成有哪些功能特点?
2025年3月25日,OpenAI通过一场直播活动正式发布了GPT-4o的原生图像生成功能,并将其集成到ChatGPT和Sora平台,用户可以通过文字提示生成高质量图像,甚至对现有图像进行风格化编辑。
2025-04-10 13:43:57人气:514℃