Skip to content

Commit e821960

Browse files
author
wok
committed
Merge branch 'master' of github.com:w-okada/voice-changer
2 parents fa77d69 + 7ab6a63 commit e821960

File tree

6 files changed

+265
-3
lines changed

6 files changed

+265
-3
lines changed

‎README.md‎

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
## VC Client
22

3-
[English](/README_en.md) [Korean](/README_ko.md)
3+
[English](/README_en.md) [Korean](/README_ko.md) [Russian](/README_ru.md)
44

55
## What's New!
66
- 姉妹品のText To Speechのクライアントをリリースしました。

‎README_dev_en.md‎

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
## For Developper
22

3-
[Japanese](/README_dev_ja.md)
3+
[Japanese](/README_dev_ja.md) [Russian](/README_dev_ru.md)
44

55
## Prerequisit
66

‎README_dev_ru.md‎

Lines changed: 124 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,124 @@
1+
Вот перевод файла `README_dev_en.md` на русский язык:
2+
3+
## Для разработчиков
4+
5+
[Японский](/README_dev_ja.md) [Английский](/README_dev_en.md)
6+
7+
## Требования
8+
9+
- Linux (Ubuntu, Debian) или WSL2 (другие дистрибуции Linux и Mac не тестировались)
10+
- Anaconda
11+
12+
## Подготовка
13+
14+
1. Создайте виртуальную среду Anaconda:
15+
16+
```
17+
$ conda create -n vcclient-dev python=3.10
18+
$ conda activate vcclient-dev
19+
```
20+
21+
2. Клонируйте репозиторий:
22+
23+
```
24+
$ git clone https://github.com/w-okada/voice-changer.git
25+
```
26+
27+
## Для серверных разработчиков
28+
29+
1. Установите необходимые зависимости:
30+
31+
```
32+
$ cd voice-changer/server
33+
$ pip install -r requirements.txt
34+
```
35+
36+
2. Запустите сервер
37+
38+
Запустите сервер с помощью следующей команды. Вы можете указать свои пути к весам моделей.
39+
40+
```
41+
$ python3 MMVCServerSIO.py -p 18888 --https true \
42+
--content_vec_500 pretrain/checkpoint_best_legacy_500.pt \
43+
--content_vec_500_onnx pretrain/content_vec_500.onnx \
44+
--content_vec_500_onnx_on true \
45+
--hubert_base pretrain/hubert_base.pt \
46+
--hubert_base_jp pretrain/rinna_hubert_base_jp.pt \
47+
--hubert_soft pretrain/hubert/hubert-soft-0d54a1f4.pt \
48+
--nsf_hifigan pretrain/nsf_hifigan/model \
49+
--crepe_onnx_full pretrain/crepe_onnx_full.onnx \
50+
--crepe_onnx_tiny pretrain/crepe_onnx_tiny.onnx \
51+
--rmvpe pretrain/rmvpe.pt \
52+
--model_dir model_dir \
53+
--samples samples.json
54+
```
55+
56+
Откройте браузер (на данный момент поддерживается только Chrome), и вы увидите графический интерфейс.
57+
58+
2-1. Устранение неполадок
59+
60+
(1) OSError: не найдена библиотека PortAudio
61+
62+
Если вы получите сообщение ниже, необходимо установить дополнительную библиотеку:
63+
64+
```
65+
OSError: PortAudio library not found
66+
```
67+
68+
Вы можете установить библиотеку командой:
69+
70+
```
71+
$ sudo apt-get install libportaudio2
72+
$ sudo apt-get install libasound-dev
73+
```
74+
75+
(2) Не запускается! Чертова программа!
76+
77+
Клиент не запускается автоматически. Пожалуйста, откройте браузер и перейдите по URL, отображаемому в консоли. И будьте осторожны со словами.
78+
79+
(3) Не удалось загрузить библиотеку libcudnn_cnn_infer.so.8
80+
81+
При использовании WSL может возникнуть ошибка `Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory`. Это часто связано с тем, что путь к библиотеке не установлен. Установите путь с помощью команды ниже. Вы можете добавить эту команду в ваш скрипт запуска, на��ример, в .bashrc.
82+
83+
```
84+
export LD_LIBRARY_PATH=/usr/lib/wsl/lib:$LD_LIBRARY_PATH
85+
```
86+
87+
- ссылки:
88+
- https://qiita.com/cacaoMath/items/811146342946cdde5b83
89+
- https://github.com/microsoft/WSL/issues/8587
90+
91+
3. Наслаждайтесь разработкой.
92+
93+
### Приложение
94+
95+
1. Windows + Anaconda (не поддерживается)
96+
97+
Используйте conda для установки PyTorch:
98+
99+
```
100+
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
101+
```
102+
103+
Также выполните эти команды:
104+
105+
```
106+
pip install chardet
107+
pip install numpy==1.24.0
108+
```
109+
110+
## Для клиентских разработчиков
111+
112+
1. Импорт модулей и начальная сборка:
113+
114+
```
115+
cd client
116+
cd lib
117+
npm install
118+
npm run build:dev
119+
cd ../demo
120+
npm install
121+
npm run build:dev
122+
```
123+
124+
2. Наслаждайтесь.

‎README_en.md‎

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
## VC Client
22

3-
[Japanese](/README_ja.md) [Korean](/README_ko.md)
3+
[Japanese](/README_ja.md) [Korean](/README_ko.md) [Russian](/README_ru.md)
44

55
## What's New!
66
- We have released a sister product, the Text To Speech client.

‎README_ru.md‎

Lines changed: 130 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,130 @@
1+
[Японский](/README_ja.md) [Корейский](/README_ko.md) [Английский](/README_en.md)
2+
3+
## Что нового!
4+
- Мы выпустили продукт-сестру - клиент Text To Speech.
5+
- Вы можете насладиться генерацией голоса через простой интерфейс.
6+
- Подробнее [здесь](https://github.com/w-okada/ttsclient).
7+
- Код тренировки Beatrice V2 теперь доступен!
8+
- [Репозиторий кода тренировки](https://huggingface.co/fierce-cats/beatrice-trainer)
9+
- [Версия для Colab](https://github.com/w-okada/beatrice-trainer-colab)
10+
- v.2.0.61-alpha
11+
- [ЗДЕСЬ](https://github.com/w-okada/voice-changer/tree/v.2)
12+
- Новые функции:
13+
- Теперь можно задавать продолжительность перекрёстного затухания.
14+
- Исправления:
15+
- Исправлена проблема, при которой неиспользуемые элементы модели влияли на производительность при объединении моделей, путём установки их значений в ноль.
16+
- v.2.0.60-alpha
17+
- Новые функции:
18+
- [Тёмный режим](https://github.com/w-okada/voice-changer/issues/1306)
19+
- [Возвращение PyTorch RMVPE](https://github.com/w-okada/voice-changer/issues/1319)
20+
- [Выбор эксклюзивного режима WASAPI](https://github.com/w-okada/voice-changer/issues/1305)
21+
- v.2.0.58-alpha
22+
- [ЗДЕСЬ](https://github.com/w-okada/voice-changer/tree/v.2)
23+
- Новые функции:
24+
- SIO Broadcasting
25+
- Встроенный ngrok (экспериментальный)
26+
- Улучшения:
27+
- Оптимизация для мобильных телефонов.
28+
- Исправления:
29+
- Неправильное отображение сообщений CUI на macOS
30+
- v.2.0.55-alpha
31+
- [ЗДЕСЬ](https://github.com/w-okada/voice-changer/tree/v.2)
32+
- Улучшения:
33+
- Снижение нагрузки на процессор для RVC
34+
- Поддержка WebSocket
35+
- Изменения:
36+
- Включение опции `no_cui` в стартовом батч-файле
37+
38+
# Что такое VC Клиент
39+
40+
1. Это клиентское ПО для выполнения преобразования голоса в реальном времени с использованием различных AI для преобразования голоса. Поддерживаемые AI:
41+
- [MMVC](https://github.com/isletennos/MMVC_Trainer) (только v1)
42+
- [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) (только v1)
43+
- [RVC (Retrieval-based Voice Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)
44+
- [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) (только v1)
45+
- [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * экспериментальный * (не по лицензии MIT, см. [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)), только для Windows, зависит от процессора (только v1)
46+
- [Beatrice v2](https://prj-beatrice.com/) (только v2)
47+
48+
2. Распределение нагрузки между разными ПК
49+
Реализация преобразования голоса работает по схеме "сервер-клиент". Вы можете запустить сервер MMVC на отдельном ПК для ��инимизации влияния на другие ресурсоёмкие процессы, такие как стриминг.
50+
51+
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
52+
53+
3. Кроссплатформенная совместимость
54+
Поддержка Windows, Mac (включая Apple Silicon M1), Linux и Google Colaboratory.
55+
56+
# Как использовать
57+
58+
Это приложение для изменения голоса с использованием MMVC и so-vits-svc.
59+
60+
Есть два основных способа использования, в порядке сложности:
61+
62+
- Использование готового исполняемого файла
63+
- Настройка окружения с Docker или Anaconda
64+
65+
## (1) Использование готовых исполняемых файлов
66+
67+
- Вы можете скачать и запустить исполняемые файлы.
68+
69+
- Смотрите [здесь](tutorials/tutorial_rvc_en_latest.md) для получения руководства. ([устранение неполадок](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md))
70+
71+
- Теперь попробовать можно на [Google Colaboratory](https://github.com/w-okada/voice-changer/tree/v.2/w_okada's_Voice_Changer_version_2_x.ipynb) (требуется аккаунт ngrok). Вы можете запустить его через кнопку "Открыть в Colab" в верхнем левом углу.
72+
73+
<img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150">
74+
75+
- Мы предлагаем версии для Windows и Mac на [hugging face](https://huggingface.co/wok000/vcclient000/tree/main)
76+
- v2 для Windows
77+
- Пожалуйста, скачайте и используйте `vcclient_win_std_xxx.zip`. Преобразование голоса можно выполнять с использованием мощного процессора без GPU или с использованием DirectML для GPU (AMD, Nvidia). v2 поддерживает как torch, так и onnx.
78+
- Если у вас Nvidia GPU, скачайте `vcclient_win_cuda_xxx.zip` для более быстрого преобразования.
79+
- v2 для Mac (Apple Silicon)
80+
- Пожалуйста, скачайте и используйте `vcclient_mac_xxx.zip`.
81+
- v1
82+
- Для Windows с Nvidia GPU скачайте ONNX (cpu, cuda), PyTorch (cpu, cuda).
83+
- Для Windows с AMD/Intel GPU скачайте ONNX (cpu, DirectML) и PyTorch (cpu, cuda). AMD/Intel GPU поддерживаются только для ONNX моделей.
84+
85+
- Для пользователей Windows: после распаковки zip-файла запустите соответствующий `start_http.bat` файл.
86+
87+
- Для Mac: после распаковки zip-файла дважды щёлкните на `startHttp.command`. Если появится сообщение о невозможности проверки разработчика, нажмите Ctrl и повторно запустите.
88+
89+
- Если подключаетесь удалённо, используйте `.command` (Mac) или `.bat` (Windows) файл с https вместо http.
90+
91+
- Энкодер DDPS-SVC поддерживает только hubert-soft.
92+
93+
- [Скачать с hugging face](https://huggingface.co/wok000/vcclient000/tree/main)
94+
95+
## (2) Использование после настройки окружения с Docker или Anaconda
96+
97+
Клонируйте этот репозиторий и используйте его. Для Windows требуется настройка WSL2. Для Mac нужно настроить виртуальные среды Python, например Anaconda. Этот метод обеспечивает наивысшую скорость в большинстве случаев. **<font color="red"> Даже без GPU можно получить достаточную производительность на современном процессоре </font>(смотрите раздел о производительности в реальном времени ниже)**.
98+
99+
[Видео-инструкция по установке WSL2 и Docker](https://youtu.be/POo_Cg0eFMU)
100+
101+
[Видео-инструкция по установке WSL2 и Anaconda](https://youtu.be/fba9Zhsukqw)
102+
103+
Для запуска Docker смотрите [start docker](docker_vcclient/README_en.md).
104+
105+
Для запуска на Anaconda venv смотрите [руководство разработчика](README_dev_ru.md).
106+
107+
Для запуска на Linux с AMD GPU смотрите [руководство](tutorials/tutorial_anaconda_amd_rocm.md).
108+
109+
# Подпись программного обеспечения
110+
111+
Это ПО не подписано разработчиком. Появи��ся предупреждение, но его можно запустить, нажав на иконку с удержанием клавиши Ctrl. Это связано с политикой безопасности Apple. Использование ПО на ваш риск.
112+
113+
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
114+
115+
https://user-images.githubusercontent.com/48346627/212569645-e30b7f4e-079d-4504-8cf8-7816c5f40b00.mp4
116+
117+
# Благодарности
118+
119+
- [Материалы Tachizunda-mon](https://seiga.nicovideo.jp/seiga/im10792934)
120+
- [Irasutoya](https://www.irasutoya.com/)
121+
- [Tsukuyomi-chan](https://tyc.rei-yumesaki.net)
122+
123+
> Это ПО использует голосовые данные бесплатного материала персонажа "Цукуёми-тян", предоставленного CV. Юмесаки Рэй.
124+
>
125+
> - Корпус Цукуёми-тян (CV. Юмесаки Рэй)
126+
>
127+
> https://tyc.rei-yumesaki.net/material/corpus/
128+
>
129+
> Авторское право. Юмесаки Рэй, Все права защищены.
130+

‎signatures/version1/cla.json‎

Lines changed: 8 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -159,6 +159,14 @@
159159
"created_at": "2024-06-15T16:27:32Z",
160160
"repoId": 527419347,
161161
"pullRequestNo": 1241
162+
},
163+
{
164+
"name": "QweRezOn",
165+
"id": 131252058,
166+
"comment_id": 2349461674,
167+
"created_at": "2024-09-13T17:04:41Z",
168+
"repoId": 527419347,
169+
"pullRequestNo": 1347
162170
}
163171
]
164172
}

0 commit comments

Comments
 (0)