Wpis z mikrobloga

Potrzebuję narzędzia do którego wrzucę kilkadziesiąt plików z dyktafonu i zostanę one obrobione tak że po wykryciu zadanego słowa dostanę i formacje w której sekundzie to słowo zostało wykryte. Druga opcja to każdy plik zostanie przekonwertowany do formy tekstowej a słowo klucz wyróżnione.
#ai #sztucznainteligencja #si
  • 3
@Niewinnyk: Są programy używające Whisper (jak np. Aiko), które transkrybują pliki audio i video a następnie mogą zapisać plik napisów srt i w nim możesz już sobie szukać kiedy słowo jest użyte. Nie jest to dokładnie to co chcesz, ale zawsze coś.
@Niewinnyk: Azure AI services, moze nawet da sie to zrobic w ramach darmowej subskrypcji gdzie daja 200 usd na start. Jezyk polski jest oficjalnie wspierany, ale nie wiem jak dziala, angielski oczywiscie w mowie naturalnej zapisuje bez najmniejszego problemu. Taki tekst mozesz sobie wyeksportowac do json i sam obrobic, dac komus aby ci napisal aplikacje lub tez uzyc innych narzedzi z Azura.