Реклама
ì´ ì›¹ì‚¬ì´íŠ¸ì— í™˜ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Који је ово језик? Кинески? Јапански?
То је заправо корејски. Ручно откривање овога би ми одузело доста времена. Срећом, пронашао сам неке веома прецизне алате који то могу да ураде аутоматски. Сви су наведени у наставку.
Експеримент: Тестирао сам веб странице користећи пример текста (1-2 реченице са 8 речи) са следећих језика: португалски, руски, корејски, вијетнамски, италијански, турски, пољски, украјински, азербејџански, словеначки, македонски, холандски, филипински (тагалог), грчки, галицијски, чешки, белоруски, фински, татарски и норвешки.
Све у свему, тестирао сам 20 различитих језика.
3 Алатке за откривање текста на непознатом језику
1. ЛангИд (положио 18 од 20 тестова, није положио татарски и белоруски)

Предности: Све у свему, одличан онлајн алат. Нуди основну функцију откривања текста и они такође имају Твиттер и ботови за откривање е-поште за још брже резултате.
Против: Њихов мотор је заснован на Гоогле АПИ-ју, али изгледа да имају боље резултате од Гоогле детектора описаног у наставку. Изгледа да знају како да добро искористе ствари. Није ми се допало што немају свој јединствени алгоритам за откривање језика.
2. Гоогле детектор језика [више није доступан] (положио 17 од 20 тестова, није положио португалски, талог и белоруски)

Предности: Гоогле има један од најбољих светских АПИ-ја за откривање језика. Добра ствар је што можете да видите да је вероватноћа да је резултат који показују истинит. Успели су да прођу већину тестова на узорку.
Против: Био сам прилично изненађен што нису прошли португалски тест. Изгледа да имају (надам се привремену) грешку са овим језиком. Такође, они сигурно могу да ураде бољи посао у побољшању дизајна странице.
3. Који је ово језик (положио 11 од 20 тестова, није положио руски, корејски, украјински, азербејџански, македонски, тагалошки, грчки, галицијски и татарски)

Предности: Неки језици попут јужнословенских (српски, хрватски, словеначки) су доста слични. У случају да унесете неки хрватски текст, рецимо, ова страница ће вам рећи да би текст могао бити и српски или словеначки.
Против: Морају да раде на томе да свој систем детекције учине софистициранијим. Размишљао сам да ставим Транслатед.нет (друга веб локација за откривање језика) уместо ове, али Транслатед је обећао откривање више језика и заправо је био лошији од ВхатЛангуагеИсТхис.цом.
2 алата за откривање веб локација на непознатим језицима
4. Гугл преводилац са Откриј језик као прва опција
Положио: 18 од 20, није прошло белоруски и татарски.
Предности: Овај алат веома добро ради свој посао. Оно што ми се свиђа Гугл преводилац Гоогле преводилац 2.1 се појављује са изворном тастатуром за иОС 7 и више језичке подршкеАжурирајте на Гоогле Транслате 2.1 на свом иОС уређају и носите подршку за превод и подршку за унос рукописа за нове језике. Гоогле преводилац коначно добија нову иОС 7 тастатуру за све... Опширније је да ако не подржава одређени језик, даје вам следећи екран:

То је одличан детектор језика ако мене питате!
5. Мицрософт Бинг преводилац са Ауто-Детецт као прва опција.

Положио: 8 од 20, није прошао холандски, вијетнамски, турски, украјински, азербејџански, словеначки, македонски, тагалошки, грчки, галицијски, чешки и белоруски
Предности: Подржава ограничен број језика. За те језике добро ради свој посао.
Против: Веома сам разочаран Мицрософтом. Имају веома ограничен број језика за откривање и превод Заборавите Гоогле преводилац: 3 начина да добијете тачан, брз преводБило да планирате да се пријавите за посао или стан у иностранству, или желите да преведете своју веб страницу, морате да исправите ствари чак и са страним језиком. Опширније а њихова функција аутоматског откривања је ужасна. У случају да унесете језик који они не подржавају, добићете погрешан резултат уместо да вам кажу да не подржавају тај језик.
Мисли
Све у свему, моје мишљење је да горе наведени алати иду у добром правцу. Они су тренутно најбољи за откривање језика на мрежи и прилично добро раде свој посао када су популарни језици у питању. Међутим, морају да раде на додавању још нејасних језика (ниједан од алата није успео да препозна татарски) и сигуран сам да ће сви они, посебно Гоогле, ићи у том правцу у блиској будућности.
Кредит за слику: Канко*
Зовем се Дарко (надимак Даррен.) Свиђа ми се Веб 2.0, креирам специјализоване веб странице (мој најновији пројекат је претрага људи) и тако даље...шта да кажем још о мени на овако кратком профилу, пратите мој на Твитеру ако желите да сазнате више :)