今日AI华为宣告4K图像模型PixArtΣPika把音效视频一锅端了

AI运用

华为发布图像天生模型PixArt-Σ 可直出4K图像

【AiBase 提要:】

⭐ 采取DiT架构，可直接天生4K图像

今日AI华为宣告4K图像模型PixArtΣPika把音效视频一锅端了

⭐ 借助PixArt-alpha根本预演习，实现弱到强演习

⭐ 结合高质量演习数据和高效Token压缩，天生高分辨率图像

项目地址:https://top.aibase.com/tool/pixart

ComfyUI-Dream-Interpreter:还原梦境的ComfyUI事情流输入梦境描述天生全景图

【AiBase提要:】

⚙️ 可通过 GitHub 克隆项目进行利用

项目结合了梦境解析器和 ComfyUI，供应梦境输入、解析和生成功能

️ 天生全景图像，让用户交互式探索梦境，创新结合梦境解析与交互画面。

Pika发布Sound Effects功能天生的视频可以自动配音效了

【AiBase提要:】

⭐ 用户可以通过描述prompt或让AI自动天生音效为视频增长氛围

⭐ Sound Effects操作大略，用户只需一个prompt或大略描述就能天生音效

⭐ 功能目前仅对特定用户开放测试，未来将向所有用户推出

项目地址:https://github.com/pwh-pwh/aiwechat-vercel

教程:https://www.bilibili.com/video/BV1Ct421b7xz/

AIwechat-Vercel:无需做事器即可将AI功能集成到公众年夜众号中

【AiBase提要:】

⭐️ 集成多种AI做事（如GPT、星火、通义千问、Gemini等），许可微信"大众年夜众号通过文本与用户进行智能对话。

⭐️ 支持连续问答，实现了超时回答和影象对话内容（最长30分钟）

⭐️ 具备图床功能和被关注时的自定义回答功能

项目地址:https://top.aibase.com/tool/aiwechat-vercel

教程:https://www.bilibili.com/video/BV1Ct421b7xz/

Optimizer AI:可为AI视频自动配音还将支持立体声

【AiBase提要:】

⭐️通过笔墨提示创造适用于各种场景的声音和音效。

⭐️支持声音效果天生、变声、风格标签指定，保持天生同等性。

⭐️即将支持文本到声音效果转换、立体声、高质量音频天生。

官网地址:https://www.optimizerai.xyz/

在线体验地址:https://discord.com/invite/bgfnVaaU2n

EasyDiffusion Online:一款免费的AI绘画工具

【AiBase提要:】

⭐ 用户可以免费利用图像天生器和提示天生器。

⭐ EasyDiffusion Online供应多种创作类型，适宜不同用户。

⭐ 平台功能强大，用户可以实现创意想法并分享作品。

体验地址:https://top.aibase.com/tool/easydiffusion-online

图片编辑技能StableDrag发布拖动锚点即可编辑图像同时保持高质量

【AiBase提要:】

⭐ 新技能StableDrag基于Diffusion模型，拖动锚点编辑图片。

⭐ 供应两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。

⭐目前只上线了论文，试玩页面和代码暂未放出

项目地址:https://top.aibase.com/tool/stabledrag

AI实时绘图工具ImgPilot 一键将草图转为艺术作品

【AiBase提要:】

⭐ 支持实时绘图，随手涂几笔就能变成好看的画

⭐ ImgPilot项目基于Lepton AI技能开拓，结合多种技能提高效果

⭐ 供应前后端代码，用户可自由定制支配

项目地址:https://github.com/leptonai/imgpilot

试玩页面:https://top.aibase.com/tool/imgpilot

MIT博士生用Vision Pro实时演习机器狗开源项目Tracking Steamer火了

【AiBase提要:】

⭐ MIT博士生开源项目Vision Pro实时演习

⭐ 运用程序利用Vision Pro追踪人类动作实时传输到其他机器人设备

⭐ 人类可以为机器人供应精准演习数据，促进人机交互技能的发展

项目地址:https://github.com/Improbable-AI/VisionProTeleop

AI新鲜事

每年电费2亿?ChatGPT每天竟然要花费1.7万个家庭的用电量

【AiBase提要:】

OpenAI旗下ChatGPT逐日花费超过50万千瓦时电力，约为1.7万个家庭的用电量。

AI数据中央用电量未来或与小国相称，谷歌等公司搜索要求也花费大量能耗。

AI技能发展需节约能源，监管机构监督企业用电行为，促进可持续发展。

Nvidia因利用侵权作品演习NeMo AI平台被作者起诉

【AiBase提要:】

三位作者控告Nvidia未经容许利用其版权图书演习NeMo AI平台。

作者指称Nvidia在NeMo演习后撤下他们的作品。

该案或成AI领域版权和数据利用主要先例，影响行业规范和公司行为。

新AI框架H2O:将人类动作实时转换为机器人动作可行走、后空翻、踢球等

【AiBase提要:】

采取可扩展的“从仿照到实际”处理，构建大规模的重定目标运动数据集。

通过演习鲁棒的全身机器人模拟者，成功实现了在真实场景中的动态全身运动遥操作。

通过特权模拟者选择可行动作，确保人形机器人对人类运动高度还原。

项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-

微软AI研究推数学LLM Orca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

【AiBase提要:】

⭐ Orca-Math通过合成数据集和迭代学习重新定义数学问题传授教化方法。

⭐ Orca-Math在GSM8K基准上取得显著造诣，展示SLM在教诲中的潜力。

⭐ Orca-Math利用迭代学习机制取获胜利，在办理数学问题方面取得显著进步。

论文地址:https://arxiv.org/abs/2402.14830

谷歌发布Gemini 1.5 Pro模型技能报告长文影象能力惊人

【AiBase提要:】

⭐ Gemini1.5Pro模型架构、演习数据与根本举动步伐先容

⭐ 长篇信息检索任务中完美的影象回溯能力

⭐ 长篇信息处理任务准确率达到99%以上

论文地址:https://arxiv.org/pdf/2403.05530.pdf

环球AI人才报告曝光:清华第三，北大第六!

【AiBase提要:】

⭐ 中国培养出的AI人才占环球近1/2

⭐ 美国码农口试需12场，薪资压低，口试题难

⭐ Meta压低薪资，裁员潮下AI人才需求狂涨42%

谷歌称Gemini Nano AI大模型暂不支持Pixel8手机

【AiBase提要:】

Gemini Nano是谷歌旗下Gemini大模型的移动版本。

由于硬件限定，Gemini Nano目前无法在Pixel8手机上运行。

但谷歌表示未来将在其他高端设备上推出Gemini Nano。

网络安全模型WhiteRabbitNeo发布可识别安全威胁和漏洞

【AiBase提要:】

⭐ WhiteRabbitNeo发布了新模型，利用Transformers和PyTorch技能，专注于网络安全领域。

⭐ 这款模型可识别各种安全威胁和漏洞，如开放端口、未加密做事、API漏洞等。

⭐ WhiteRabbitNeo模型还可运用于编程和代码天生领域，帮助办理编程问题。

————————————

今日Midjourney提示词分享:梨花树下的女孩

垫图+ masterpiece，best quality，A beautiful Chinese girl wearing a beige suit jacket，black hair，short hair，round face，detailed facial details，natural light，glasses，solo，photo background，outdoors，shirt，realistic，looking at viewer，tree，a tree full of pear blossoms，teeth，crossed arms，white shirt，long hair，smile，round eyewear，long sleeves，day，jacket，upper body，high definition photography，Captured by Canon camera --ar 3:4 --s 750 --style raw --v 6.0

每期AI知识网

今日AI华为宣告4K图像模型PixArtΣPika把音效视频一锅端了

计算机视觉图像检测和图像瓜分有什么差异

相亲网站设计主题,打造浪漫邂逅的数字化舞台