Произвођачи ЦхатГПТ-а имају још један алат који има за циљ да скине оптерећење са ваших прстију.
Исти људи који стоје иза ЦхатГПТ-а су креирали још један алат заснован на вештачкој интелигенцији који данас можете да користите да повећате своју продуктивност. Мислимо на Вхиспер, решење за претварање гласа у текст које је засјенило сва слична решења која су постојала пре њега.
Можете користити Вхиспер у својим програмима или командној линији. Па ипак, то поражава саму његову сврху: куцање без тастатуре. Ако треба да куцате да бисте га користили, зашто га користити да бисте избегли куцање? Срећом, сада можете да користите Вхиспер преко графичког интерфејса радне површине. Још боље, може да транскрибује ваш глас скоро у реалном времену. Хајде да видимо како можете да куцате гласом користећи Вхиспер Десктоп.
Шта је ОпенАИ-јев шапат?
ОпенАИ-јев Вхиспер је систем за аутоматско препознавање говора (скраћено АСР) или, поједностављено речено, представља решење за претварање говорног језика у текст.
Међутим, за разлику од старијих система за диктирање и транскрипцију, Вхиспер је АИ решење обучено на преко 680.000 сати говора на различитим језицима. Вхиспер нуди неупоредиву прецизност и, што је прилично импресивно, не само да је вишејезичан, већ може и да преводи између језика.
Још важније, бесплатан је и доступан као отворени код. Захваљујући томе, многи програмери су уградили његов код у сопствене пројекте или креирали апликације које се ослањају на њега, као што је Вхиспер Десктоп.
Ако бисте више волели „ванилу“ верзију Вхиспера и свестраност терминала уместо незграпних ГУИ, погледајте наш чланак о како претворити свој глас у текст помоћу ОпенАИ-овог Вхиспер-а за Виндовс.
Да ли су Вхиспер и Вхиспер Десктоп исти?
Упркос свом званичном имену, Вхиспер Десктоп је ГУИ треће стране за Вхиспер, направљен за све који би радије кликнули на дугмад уместо да куцају команде.
Вхиспер Десктоп је самостално решење које се не ослања на постојећу Вхиспер инсталацију. Као бонус, користи алтернативну, оптимизовану верзију Вхиспер-а, тако да би требало да ради боље од самосталне верзије.
Ви сте на другом крају спектра и уместо да тражите лакши начин да користите Вхиспер од терминала, тражите начине да га имплементирате у своја сопствена решења? Радуј се, за ОпенАИ је отворио приступ ЦхатГПТ и Вхиспер АПИ-јима.
Преузмите и инсталирајте Вхиспер Десктоп
Иако је Вхиспер Десктоп лакши за коришћење него самостални Вхиспер, његова инсталација је сложенија од сталног кликања на Нект у чаробњаку.
- Посетите Званична Гитхуб страница Вхиспер Десктоп-а. Погледајте десно и кликните на најновију верзију испод Издања.
- Испод Средства, кликните ВхисперДесктоп.зип и преузмите га на свој рачунар.
- Извуците преузету архиву у фасциклу и посетите је помоћу менаџера датотека. Унутра ћете пронаћи апликацију Вхиспер Десктоп. Двапут кликните на њега да бисте га покренули.
- Потребан вам је и модел језика шапата ГЦМЛ бинарни формат. Вхиспер Десктоп ће вам пружити две везе за преузимање једне. Прескочите другу везу за генерисање сопственог модела јер је то компликованији процес. Кликните на Хуггинг Фаце да отворите ту страницу у вашем подразумеваном претраживачу, одакле можете преузети датотеку спремну за употребу.
- Верзија Вхиспер Десктоп-а коју смо користили док смо писали овај чланак пружила је везу до застарелог спремишта на Хуггинг Фаце-у. Ако наиђете на исти проблем, приметите везу до а нова локација. Кликните на њега да посетите ново спремиште.
- Кликните на линк који ће вас одвести до доступних модели.
- Са те листе кликните на било коју ггмл-медиум.бин или ггмл-медиум.ен.бин, у зависности од тога да ли желите подршку на више језика или само на енглеском за Вхиспер.
- Коначно, требало је да стигнете на одредиште. Обратите пажњу на ред у коме се наводи да је ова датотека ускладиштена у Гит ЛФС-у и да је превелика за приказ, али и даље можете да је преузмете. Кликните на преузимање да уради управо то.
- Када се датотека заврши преузимање, користите свој омиљени менаџер датотека (Филе Екплорер ће то учинити) да преместите преузету датотеку језичког модела у исту фасциклу као и Вхиспер Десктоп.
Транскрибовање помоћу Вхиспер Десктоп
Транскрибовање помоћу Вхиспер Десктоп-а је једноставно, али ће вам и даље можда требати један или два клика да бисте користили апликацију.
Поново покрените Вхиспер Десктоп. Да ли (и даље) недостаје тачна путања до вашег преузетог језичког модела? Кликните на дугме са три тачке на десној страни поља и ручно изаберите датотеку коју сте преузели са Хуггинг Фаце.
Са овог места можете користити и падајући мени поред Имплементација модела да изаберете да ли желите да покренете Вхиспер на свом ГПУ-у (ГПУ), и на ЦПУ и на ГПУ (Хибрид), или само на ЦПУ (Референца).
Тхе Напредно дугме води до више опција које утичу на то како ће Вхиспер радити на вашем хардверу. Међутим, пошто дугме јасно каже да су напредни, предлажемо да их подесите само ако решавате проблеме или знате шта радите. Постављање погрешних вредности опција овде може довести до смањења перформанси или учинити апликацију неупотребљивом.
Кликните на ОК да бисте прешли на главни интерфејс апликације.
Ако већ имате снимак свог гласа који желите да претворите у писани текст, кликните на Датотека за транскрипцију и изаберите га. Ипак, користићемо Вхиспер Десктоп за живу транскрипцију за овај чланак.
Понуђене опције су једноставне. Можете одабрати Језик Шапат ће користити, изаберите ако желите превести између језика и омогућите апликацију Дебуг Цонсоле.
Већина корисника који говоре енглески може безбедно да прескочи те опције и само обезбеди да је тачан аудио улаз изабран из падајућег менија поред Уређај за снимање.
Буди сигуран Сачувај у текстуалну датотеку и Додај у ту датотеку су омогућени да Вхиспер Десктоп сачува свој излаз у датотеци без преписивања њеног садржаја. Користити дугме са три тачке на десној страни поља путање датотеке да бисте дефинисали поменуту текстуалну датотеку.
Кликните на Цаптуре да почнете да транскрибујете свој говор у текст.
Вхиспер Десктоп ће вам показати три индикатора када детектује гласовну активност, када активно преписује и када је процес заустављен.
Можете да наставите да причате колико год желите, а требало би да повремено видите да два прва индикатора трепере док апликација претвара ваш глас у текст. Кликните Зауставити по завршетку.
Текстуални фајл који сте изабрали требало би да се отвори у вашем подразумеваном уређивачу текста и да садржи у писаној форми све што сте рекли док нисте кликнули Зауставити.
Треба напоменути да можете учинити и супротно од онога што смо видели овде: претворити било који текст у говор. На овај начин можете да слушате било шта као да је подцаст уместо да замарате очи шкиљећи у екране. За више информација о томе, погледајте наш чланак о неки од најбољих бесплатних онлајн алата за преузимање текста у говор као МП3 аудио.
Савети за куцање гласом Вхиспер на радној површини
Иако Вхиспер Десктоп може бити спас, омогућавајући вам да пишете својим гласом много брже него што бисте могли да куцате, далеко је од савршеног.
Током нашег тестирања, открили смо да повремено може да замуцкује, да прескаче неке речи, да не транскрибује док не ручно зауставите и поново покрените процес или се заглавите у петљи и наставите да поново транскрибујете исту фразу у више наврата.
Верујемо да су то привремене грешке које ће бити поправљене јер самостални Вхиспер не показује исте проблеме.
Осим тих мањих неравнина, претварање гласа у текст требало би да буде лако са Вхиспер Десктоп-ом. Ипак, током наших тестова открили смо да може да ради још боље ако...
- Уместо да изговори само две или три речи и затим застане, Шаптач ће вас боље разумети ако наставите дуже. Покушајте да му дате бар целу реченицу одједном.
- Из истог разлога избегавајте стално покретање и заустављање процеса транскрипције.
- Кад год схватите да сте погрешили, игноришите то и наставите даље. Чини се да је учитавање и истовар језичког модела део процеса који одузима највише времена са тренутним стањем Вхиспер-а и нашим доступним хардвером. Дакле, брже је да наставите да причате, а затим исправите своје грешке након тога.
- Као и код самосталне верзије Вхиспер-а, најбоље је да користите оптимални језички модел за ваш расположиви хардвер. Можете користити до средње модел ако ваш ГПУ има 8 ГБ ВРАМ-а. За мање ВРАМ-а, идите на мање моделе. Изаберите само мало тачније, али и много захтевније велики модел ако користите ГПУ са 16 ГБ ВРАМ-а или више.
- Запамтите да што је већи језички модел, спорији је процес транскрипције. Не идите на модел већи него што је потребно. Вероватно ћете открити да вас Вхиспер Десктоп већ може „разумети“ већину времена са средњим или мањим моделима, са само једном или две грешке по пасусу.
Да ли још увек куцате? Користите свој глас са шапатом
Упркос томе што је потребно неко време за подешавање, као што ћете видети када га испробате, Вхиспер Десктоп ради много боље од већине алтернатива, са много већом прецизношћу и бољом брзином.
Након што почнете да је користите за куцање гласом, ваша тастатура може изгледати као реликвија из давних времена.