2024AI能力大总结,看这一个视频够了

本文章内容的视频版本:

YouTube video

From 2023年底,我们频道成立了,那一年最火的就两个:
– ChatGPT
– StableDiffusion
这两个能火起来,源于人们猎奇的本性。
他们一个是神奇,一个是创意

发展到今天,2024年成长了一年,AI又到了什么地步了呢?

AI 永远是要服务应用的,应用就四个点:
– 文本
– 图片
– 音频
– 视频

文本:不是内容本身而是其可以拟人化
– llama3.2-7B
– Qwen2.5-14B

图片:分两种
– 质量提升
– 创意生成

音频:这个就太多了,从源头起
– 识别声音:whisper
– TTS:
额外的:
– 音色调整:
– 去噪:uvr5
– 音源分离:vocal
– 音源合成:suno

视频:
– Upscaler :通用的:realesrgan,卡通的 waifu2x
– 修复的:一般般
– 视频生成:👍PyramidFlow https://studio.youtube.com/video/jbT8aDY5Rfk/edit
– 唇形同步(LibSync):
– 图生视频:Hallo2,EchoMimic2
– 视频生视频:VideoRetalking,DHLive(据说训练到2W步效果不错)

牛哥的数字人项目其实也是在解决这类问题:
原始视频提取 512×512 头像视频 => 魔改图生视频到视频生视频 => (这中间可能添加一个人脸增强) => 合并回原始视频
牛哥项目: https://niugee.com/ai-robot-tts-all-in-one/

本文提到的所有项目,基本上:
1. 在牛哥官网都有一键大包或者部署视频,如果没有的,@我,我就做: https://niugee.com/
2. 相关源码都在github: https://github.com/NiuGee
3. 模型基本Huggface可下载: https://huggingface.co/
最后这俩基本是AI开源必须了解的网站,如果还有不会用的,牛哥官网都有小白扫盲视频

纵观2024年牛哥的视频,其实核心就是两点:
1. 让更多小白可以上手AI,时代浪潮前,咱们别掉队
2. 有想法有能力的,可以基于AI赚点钱,梦想总是要有的,有句话叫:站在风口上,猪都会飞。何况咱们都是精英!~

牛哥致力于让大家低成本玩起来,所以才有了云服务到本地的桥接,才有了各种必备的部署(从小白的第一台服务器开始,到最终建立自己的专业网站,架设本地AI服务器)

都到这里了,给牛哥点个赞吧,更希望你开个Youtube会员(有福利哦),2025我们一起成长

站内快搜



联系牛哥

加入牛哥的 TG 群组一起交流

=>>Telegram群组(点我加入)

有特殊情况的,需要单独沟通,可以添加牛哥的 微信 或者 Telegram