Grootste tekst-naar-spraak AI-model tot nu toe toont ‘opkomende vaardigheden’
Onderzoekers bij Amazon hebben het grootste tekst-naar-spraak-model ooit getraind, waarvan zij beweren dat het ‘opkomende’ eigenschappen vertoont, waardoor het vermogen om zelfs complexe zinnen op natuurlijke wijze uit te spreken wordt verbeterd.
Het nieuwe model heet Big Adaptive Streamable TTS met Emergent-vaardigheden, wat ze hebben omgezet in de afkorting BASE TTS. De grootste versie van het model maakt gebruik van 100.000 uur aan spraak in het publieke domein, waarvan 90% in het Engels, de rest in het Duits, Nederlands en Spaans.
Bron: Techcrunch
Paper: by Amazon