883330.jpg

spade_a

大佬太强了

1439175.jpg

墨血红尘

刚才还在用之前一位大佬的500小时,没想到搜了下出了个3500,厉害,我对比下效果,这样集成挺适合小白的。花大价钱升级到N卡的好处这就体现出来了。

就是Mega下载起来比较慢,如果有度盘就好了。

顺便等一版large v2的

不知道为什么跑GPU(不是低显存)的时候,GPU 只占用了5%以下,是不是我CUDA不对,安的是最新版的,显卡是4070tis

好像只能在一个文件夹下翻译,跨文件夹就会扫描不到,要加啥才能任何地方拖进去都能跑?

9.png

海南鸡饭

回 60楼(狂奔的super) 的帖子

可能这个卡他, 不支持这种量化…
可以试试改一下bat文件,把  int8_float16  改成  int8_float32

9.png

海南鸡饭

回 63楼(墨血红尘) 的帖子

那再更新下显卡驱动试试,正常调用的话是可以基本吃满GPU的,哪怕是4090

跨文件夹扫描不到具体是什么情况,我这好像没这个问题

none.gif

狂奔的super

Re:回 60楼(狂奔的super) 的帖子

我按你的方法做了,奇怪的是有一些文件能完整运行,有的运行到一半就遇到以下问题:
Traceback (most recent call last):
  File "infer.py", line 238, in <module>
  File "infer.py", line 184, in generates
  File "faster_whisper\transcribe.py", line 1175, in restore_speech_timestamps
  File "faster_whisper\transcribe.py", line 580, in generate_segments
  File "faster_whisper\transcribe.py", line 870, in generate_with_fallback
RuntimeError: CUDA failed with error out of memory
[2796] Failed to execute script 'infer' due to unhandled exception!

有的文件上一次不能运行,下一次反而能运行了。我这张卡可能真的不合适吧

引用
引用第64楼c95ee488于2024-06-30 12:17发表的 回 60楼(狂奔的super) 的帖子 :
可能这个卡他, 不支持这种量化…
可以试试改一下bat文件,把  int8_float16  改成  int8_float32

9.png

海南鸡饭

回 66楼(狂奔的super) 的帖子

这个报错就是显存不够了的意思,如果有的可以正常跑的话,可以试试把浏览器啥的可能吃显存的东西关了之后再跑(任务管理器里可以看到进程的显存使用情况)

6.gif

cen00

感谢大佬

664848.jpg

死跑龙套的

B69F  2024-07-01 08:26
(Trying so hard to be free)
谢大佬分享!

1565174.jpg

950c4515

B70F  2024-07-01 17:37
(行尸走肉)
大佬牛逼

732307.jpg

88a8ed15

B71F  2024-07-01 20:53
(幸運興)
大佬,請問有沒有針對英文的模型?

bfbb613b2c74ad9a97b26c0baf52750a.jpg

墨染此岸

谢谢大佬

9.png

海南鸡饭

回 71楼(88a8ed15) 的帖子

没有,而且手头也没有这类数据可以拿来训练,可以看看有没有其他的转录+翻译的方案

none.gif

909dc0d3

感谢大佬分享

a9.gif

kurisu

B75F  2024-07-02 01:23
(喜欢接盘)
感谢分享

5.gif

相麻堇

图片:
大佬这是咋回事啊,驱动是最新的,梯子也关了,想请教一下

9.png

海南鸡饭

回 76楼(相麻堇) 的帖子

你截图里的这个程序不是我写的(也不是这个帖子里提供的),我也不知道他里面是什么逻辑,建议咨询开发这个程序的人

none.gif

94566c05

太强了,大佬牛啊

1325230.bmp

那风吹

    

none.gif

天登式明村

B80F  2024-07-04 15:12
(llngouangk1)
先点赞     
再请问这个数据集是什么类型啊,只包括ASMR 还是AV 或是正常日语视频都可以用啊?

a13.gif

灵梦

赞赞赞,v2这么快就出来了

9.png

海南鸡饭

回 80楼(天登式明村) 的帖子

训练数据集只有ASMR,拿去翻译别的的效果就不知道了

a3.gif

潜水大王

大佬牛逼,不过怎么v3比v2差啊,原版也是……
抱抱脸上的5k步V2感觉吊打4K步的V3……

none.gif

尼特馬

    

9.png

海南鸡饭

回 83楼(潜水大王) 的帖子

v3垃圾数据喂多了,纸面参数强,实际用起来不如v2

9.png

大绅士23233

Traceback (most recent call last):
  File "infer.py", line 248, in <module>
  File "infer.py", line 190, in generates
  File "faster_whisper\transcribe.py", line 1175, in restore_speech_timestamps
  File "faster_whisper\transcribe.py", line 580, in generate_segments
  File "faster_whisper\transcribe.py", line 870, in generate_with_fallback
RuntimeError: CUDA failed with error out of memory
[25016] Failed to execute script 'infer' due to unhandled exception!
为啥有些文件并不是很大,其他比他更大的都不爆显存,唯独这个有问题

9.png

大绅士23233

回 86楼(大绅士23233) 的帖子

而且是在全部识别翻译完,就差生成lrc的时候爆了

9.png

海南鸡饭

回 87楼(大绅士23233) 的帖子

显存不够这个没办法,可以尝试把吃显存的程序关了之后跑这个(任务管理器里可以看到),还是爆显存的话,可以用低显存模式

9.png

大绅士23233

回 88楼(海南鸡饭) 的帖子

已经是低显存模式了

祓怎么读


9.png

海南鸡饭

回 89楼(大绅士23233) 的帖子

那只能CPU模式慢慢跑了。。。

3.gif

d9123ae8