Bert-vits2-2.3-Final,Bert-vits2最终版一键整合包(复刻生化危机艾达王)

    近日,Bert-vits2发布了最新的版本2.3-final,意为最终版,修复了一些已知的bug,添加基于 WavLM 的 Discriminator(来源于 StyleTTS2),令人意外的是,因情感控制效果不佳,去除了 CLAP情感模型,换成了相对简单的 BERT 融合语义方式。    事实上,经过2.2版本的测试,CLAP情感模型的效果还是不错的,关于2.2版本,请移步:Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文......

Bert-vits2-2.3-Final,Bert-vits2最终版一键整合包(复刻生化危机艾达王)

云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)

    假如我们一定要说深度学习入门会有一定的门槛,那么设备成本是一个无法避开的话题。深度学习模型通常需要大量的计算资源来进行训练和推理。较大规模的深度学习模型和复杂的数据集需要更高的计算能力才能进行有效的训练。因此,训练深度学习模型可能需要使用高性能的计算设备,如图形处理器(GPU)或专用的深度学习处理器(如TPU),这让很多本地没有N卡的同学望而却步。    GoogleColab是由Google提供的一种基于云的免费Jupyter笔记本环境。它可以帮......

云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)

Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文模型miko)

    近日,Bert-vits2-v2.2如约更新,该新版本v2.2主要把Emotion 模型换用CLAP多模态模型,推理支持输入text prompt提示词和audio prompt提示语音来进行引导风格化合成,让推理音色更具情感特色,并且推出了新的预处理webuI,操作上更加亲民和接地气。    更多情报请参见Bert-vits2官网:https://github.com/fishaudio/Bert-VITS2/releases/tag/v2.2&......

Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文模型miko)

衡兰芷若成绝响,人间不见周海媚(4k修复基于PaddleGan)

    一代人有一代人的经典回忆,1994年由周海媚、马景涛、叶童主演的《倚天屠龙记》曾经风靡一时,周海媚所诠释的周芷若凝聚了汉水之钟灵,峨嵋之毓秀,遇雪尤清,经霜更艳,俘获万千观众,成为了一代人的共同记忆。    如今美人仙去,回望经典,雪肤依然,花貌如昨,白璧微瑕之处是九十年代电视剧的分辨率有些低,本次我们利用百度自研框架PaddleGan的视频超分SOTA算法来对九十年代电视剧进行4K修复。    配置PaddlePaddle框架......

衡兰芷若成绝响,人间不见周海媚(4k修复基于PaddleGan)

两亿大奖,一夜暴富,江西彩票、概率学、阴谋论暨景观社会

    近日,中国福彩“快乐8”选七玩法中有一人投注近5万倍共中2.2亿余元,两个小目标,一夜全自由,如果你以为这是故事,那么你错了,如果你以为这是生活,那么我们都错了。    “快乐8”的快乐是真的快乐    快乐如果也分等级,那“快乐8”选10一等大奖快乐一定比选1的要高级很多。    首先明确一下“快乐8”一等奖的规则:投注人从80个数(1-80)中选10个数,开奖时会从80个数中开出20个......

两亿大奖,一夜暴富,江西彩票、概率学、阴谋论暨景观社会

Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)

    中英文混合输出是文本转语音(TTS)项目中很常见的需求场景,尤其在技术文章或者技术视频领域里,其中文文本中一定会夹杂着海量的英文单词,我们当然不希望AI口播只会念中文,Bert-vits2老版本(2.0以下版本)并不支持英文训练和推理,但更新了底模之后,V2.0以上版本支持了中英文混合推理(mix)模式。    还是以霉霉为例子:https://www.bilibili.com/video/BV1bB4y1R7Nu/    截取......

Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)

义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

    Bert-vits2更新了版本V210,修正了日/英的bert对齐问题,效果进一步优化;对底模使用的数据进行优化和加量,减少finetune失败以及电音的可能性;日语bert更换了模型,完善了多语言推理。    更多情报请参考Bert-vits2官网:https://github.com/fishaudio/Bert-VITS2/releases/tag/2.1    最近的事情大家也都晓得了,马督工义无反顾带头冲锋,身体力行地......

义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

本地训练,立等可取,30秒音频素材复刻霉霉讲中文音色基于Bert-VITS2V2.0.2

    之前我们使用Bert-VITS2V2.0.2版本对现有的原神数据集进行了本地训练,但如果克隆对象脱离了原神角色,我们就需要自己构建数据集了,事实上,深度学习模型的性能和泛化能力都依托于所使用的数据集的质量和多样性,本次我们在本地利用Bert-VITS2V2.0.2对霉霉讲中文的音色进行克隆实践。    霉霉讲中文的原始音视频地址:https://www.bilibili.com/video/BV1bB4y1R7Nu/   &nb......

本地训练,立等可取,30秒音频素材复刻霉霉讲中文音色基于Bert-VITS2V2.0.2

中国版OJ辛普森案,朱令案暨疑罪从无

    楔子    毫无疑问,面对一桩刑事案件时,旁观者始终处于一个脆弱无知的状态。人们会被无数可能的事情影响对某件事情的判断 ,而真相,只有那个人知道。因此法治社会下不得不倚重于法律程序来做出判断。而一旦执掌法律武器的权力机构受到质疑,事情的发展通常都会是灾难性的。        1994年,前美式橄榄球运动员O·J·辛普森(O.J. Simpson)杀妻一案成为当时美国最为轰动的事件......

中国版OJ辛普森案,朱令案暨疑罪从无

本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)

    按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。    Bert-VITS2 V2.0.2基于现有数据集    目前Bert-VITS2 V2.0.2大体上有两种训练方式,第一种是基于现有数据集,即原......

本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)

又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷电将军八重神子一键推理整合包分享

    Bert-vits2项目近期炸裂更新,放出了v2.0.2版本的代码,修正了存在于2.0先前版本的重大bug,并且重炼了底模,本次更新是即1.1.1版本后最重大的更新,支持了三语言训练及混合合成,并且做到向下兼容,可以推理老版本的模型,本次我们基于新版V2.0.2来本地推理原神小姐姐们的音色模型。    具体的更新日志请参见官网:https://github.com/fishaudio/Bert-VITS2/releases   ......

又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷电将军八重神子一键推理整合包分享

一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed)

    我们知道Python是一门解释型语言,项目运行时需要依赖Python解释器,并且有时候需要安装项目中对应的三方依赖库。对于专业的Python开发者来说,可以直接通过pip命令进行安装即可。但是如果是分发给其他的Windows用户,特别是不熟悉Python的人来说,这样过于繁琐。因此最好的办法是连同Python解释器和Python项目打包在一起,通过嵌入式一键整合包解决项目的分发问题。    本次我们以一键扒谱的项目为例子,演示如何将项目直接打包为一......

一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed)

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

    所谓"扒谱"是指通过听歌或观看演奏视频等方式,逐步分析和还原音乐作品的曲谱或乐谱的过程。它是音乐学习和演奏的一种常见方法,通常由音乐爱好者、乐手或学生使用。    在扒谱的过程中,人们会仔细聆听音乐作品,辨别和记录出各个音符、和弦、节奏等元素,并通过试错和反复推敲来逐渐还原出准确的曲谱或乐谱。这对于那些没有正式乐谱或想学习特定曲目的人来说,是一种有效的方式。    扒谱的目的是为了更好地理......

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

    懂乐理的音乐专业人士可以通过写乐谱并通过乐器演奏来展示他们的音乐创意和构思,但不识谱的素人如果也想跨界玩儿音乐,那么门槛儿就有点高了。但随着人工智能技术的快速迭代,现在任何一个人都可以成为“创作型歌手”,即自主创作并且让AI进行演唱,极大地降低了音乐制作的门槛。    本次我们基于PaddleHub和Diffsinger实现音频歌声合成操作,魔改歌曲《学猫叫》。    配置PaddleHub    首先确保本......

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

春秋笔法,微言大义,中山二院“癌症事件”情况说明解析

    公元2023年11月8日凌晨2点20分,广州的中山医科大学孙逸仙纪念医院发布关于“癌症事件”的情况说明:    第一段:我院关注到网络上有传播“中山二院乳腺外科团队疑受实验环境和试剂影响致多人患癌”等信息。医院迅速组织调查核实,初步了解到:近年在乳腺肿瘤中心实验室工作、学习过的人员中有3名罹患癌症,其中2名现为我院乳腺外科医生,在临床工作;另外1名不是我院职工或学生,为外地来院进修人员,已回原单位工作。该实验室无在读学生患癌。  &nbs......

春秋笔法,微言大义,中山二院“癌症事件”情况说明解析

持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

    Faster-Whisper是Whisper开源后的第三方进化版本,它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等,从而减少了计算量和内存消耗,提高了推理速度,与此同时,Faster-Whisper也改进了推理算法、优化计算过程、减少冗余计算等,用以提高模型的运行效率。    本次我们利用Faster-Whisper对日语视频进行双语(日语/国语)转录实践,看看效率如何。  &nbs......

持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

    诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。    BERT的核心思想是通过在大规模文本语料上进行无监督预训练,学习到通用的语言表示,然后将这些表示用于下游任务的微调。相比传统的基于词嵌入的模型,BERT引入了双向上下文信息的建模,使得模型能够更好地理解......

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

    视频以及图片修复技术是一项具有挑战性的AI视觉任务,它涉及在视频或者图片序列中填补缺失或损坏的区域,同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来,两种突出的方案在视频修复中崭露头角:flow-based propagation和spatiotemporal Transformers。尽管两套方案都还不错,但它们也存在一些局限性,如空间错位、时间范围有限和过高的成本。    说白了,你通过AI技术移除水印或......

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

AIGC革新,将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

    很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图,这样可以有效的防止用户的一些“导流”行为。当然,头像、文章或者视频现在都是AI来审,毕竟现在人工的成本实在太高,但是如果我们把文字元素直接融入图像或者视频之中,如此一来,AI也会很难识别出一些“导流”的元素。    本次我们依靠PIKA-labs平台,无需本地环境,直接简单粗暴输出带有文字元素的光影视频效果,基于Python3.10。    文字/图片生成视频&nbs......

AIGC革新,将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

《卖炭翁》致敬河北程序员,初读已解诗中意,再读却是诗中人!

起初他们追杀共产主义者的时候,我没有说话——因为我不是共产主义者;接着他们追杀犹太人的时候,我没有说话——因为我不是犹太人;后来他们追杀工会成员的时候,我没有说话——因为我不是工会成员;此后他们追杀天主教徒的时候,我没有说话——因为我是新教教徒;最后他们奔我而来,那时已经没有人能为我说话了。    这一首著名的《我没有说话》是德国神学家马丁・尼莫拉牧师的忏悔诗,尽管他写的是自己,但这首诗却振聋发聩,发人深省,其描述忽视与表面上自己无关的团体所造成的结果。该诗后来常被引用,作为......

《卖炭翁》致敬河北程序员,初读已解诗中意,再读却是诗中人!