Wpis z mikrobloga

@majsterV2: Na tę chwilę widzę jeden duży problem - nierówny poziom dźwięku. To będzie słychać i trudno się tego będzie pozbyć. Kiedyś chyba widziałem jakiś soft do wycinania głosu z nagrania, kwestia by potem wyciąć pojedyncze słowa i je skatalogować.
@majsterV2: O przetwarzaniu języka naturalnego zbyt wiele nie wiem. Do stworzenia transkryptu można by wykorzystać rozpoznawanie mowy na tekst od Google ale boty do konwersacji zwykle robi się w oparciu o zbiór zawierający pary (pytanie - odpowiedź). Natanek to w większości monologi.