Автор Тема: Переводчики Google vs. Yandex - эпический фэйл  (Прочитано 4102 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
оригинал

Duragloss FGPC (Fiberglass Polish & Cleaner) contains synthetic polymers, which form a protective coating on the surface of painted vehicles. It is durable to both acid and alkaline washes. Can be applied in the sun or shade to the entire vehicle before removing easily for a "wet look" shine and protective coating.

Google
Duragloss FGPC (стеклоткани польских и Cleaner) содержит синтетические полимеры, которые образуют защитный слой на поверхности окрашенных автомобилей. Он прочен как кислой и щелочной мойки. Может применяться на солнце или в тени на весь автомобиль, прежде чем снимать легко для "влажный взгляд" блеск и защитного покрытия.

Yandex
Duragloss FGPC (Стеклоткани Польский И экологически Чистые) содержит синтетических полимеров, которые образуют защитный слой на поверхности окрашенных транспортных средств. Она достаточно прочная, чтобы оба кислотных и щелочных моет. Может применяться на солнце или в тени, чтобы весь корабль до того, как легко для "мокрый вид" обуви и защитных покрытий.

шокирует, что англоязычный гугл не смог осилить слово Очиститель, а яндекс родил слова Экологически (откуда, пст!?) и Корабль (даже в карманном словарике так не лажают..)

влажный взгляд почти доконал


Откуда оба ресурса-миллиардера родили слово ОБУВЬ для меня вообще потрясающая загадка... :bt:

про слово Полироль, которое гандекс перевели как Польские вообще молчу.

и ведь кто-то ими переводит и даже бабло рубит на фрилансе  :bj:
  №1 for detaling maniacs


Оффлайн rockerzz

  • Старожил
  • ****
  • Сообщений: 762
  • Карма: 118
  • Пол: Мужской
  • Freefly
    • Просмотр профиля
Расскажите лучше какие же "смысловые маркеры" надо поставить для "Fiberglass Polish & Cleaner", чтобы при помощи машинного перевода понять, что это идиома. Да еще и с заглавной буквы все. А то может это ФИО двух мужиков...
Fly like a brick

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
вот только это не идиома  :ag:

но вообще достаточно было одного маркера synthetic, чтобы понять, что синетический не поляк и уж точно не Клинер
добавив маркер fiberglass (ну предложите мне второй вариант перевода слова))) можно из 3..ну 10 вариантов выбрать правильный.
для современного компа - мелочь
кстати, если уж за анализ, то устойчивое сочетание полироль и очиститель и в гугле и в яндексе фильтруется миллионы раз. какая такая логика у их переводчика, если он даже свою базу не использует - мне непонятно.

но даже без маркеров, тупым прямым переводом слов последовательно выходит Стеклопластиковый полироль и очиститель. Но никак не та стохастика от яндекса и гугла.
« Последнее редактирование: 03.06.11, 23:42:53 от Ra »
  №1 for detaling maniacs

Оффлайн Ser.

  • Ветеран
  • *****
  • Сообщений: 9206
  • Карма: 270
  • Пол: Мужской
    • Просмотр профиля
Директ использует наборы фраз как нечто бессвязное - просто устойчивый набор символов без скрытой смысловой нагрузки. На этом некоторые горе СЕО-шники раскручивали доменки под продажу - тупо помещая в оглавлении страниц перечень популярных запросов вообще не связанных между собой смыслом. :bm:
З.ы гляньте плз, личку...
З.з.ы. Как отключить т9 на айпаде? - заманал!
Бороться и искать, найти и перепрятать. (с)
Опыт позволяет нам ошибаться гораздо увереннее. (с)

Знайся только с достойными дружбы людьми,
С подлецами не знайся, себя не срами,
Если подлый лекарства нальет тебе - вылей!
Если мудрый подаст тебе яду - прими! (c)

Оффлайн LEO

  • Ветеран
  • *****
  • Сообщений: 4417
  • Карма: 310
  • Пол: Мужской
    • Просмотр профиля
но вообще достаточно было одного маркера synthetic, чтобы понять, что синетический не поляк и уж точно не Клинер

а если бы предложение было о поляке, который что-нибудь делает с синтетическими полимерами ("польский ученый их открыл" или просто "поляк их использует")?
http://is.gd/fpTeSMПродам книжки про Ajax и ASP.NET, http://is.gd/lDL64HПриглашаю в Dropbox

Оффлайн Ser.

  • Ветеран
  • *****
  • Сообщений: 9206
  • Карма: 270
  • Пол: Мужской
    • Просмотр профиля
Поляк просрал все полимеры*  :ag:
-устойчивое выражение :bk:
Бороться и искать, найти и перепрятать. (с)
Опыт позволяет нам ошибаться гораздо увереннее. (с)

Знайся только с достойными дружбы людьми,
С подлецами не знайся, себя не срами,
Если подлый лекарства нальет тебе - вылей!
Если мудрый подаст тебе яду - прими! (c)

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
а если бы предложение было о поляке, который что-нибудь делает с синтетическими полимерами ("польский ученый их открыл" или просто "поляк их использует")?

открою секрет - в английском языке порядок слов неизменен. подлежащее-сказуемое-все остальное. ну в общем лингвистом для этого не надо быть, я это в словаре армейской лексики минобороны в школе прочитал среди общих правил для солдат. лингвист нужен для суммирования событий неправильного порядка слов - например, для усиления, вопроса или придания сослагательного наклонения. это тоже ограничено, ничего сложного.

так вот банальная проверка порядка слов в предложении уже 50% работы сделала бы. и никогда полиш не был бы польским, потому что вокруг него нет ни одного глагола. а в английском даже прилагательные не могут без глаголов. Am I clear?
(без глагола am прилагательное clear невозможно, устойчивое кстати выражение, без маркера неопределяемое - нужен какой-то контекст. Но если оно тупо в базе лежит и без контекста используется переводчиком то попадание будет 90%, а не 10% как сейчас). Но базы нет. и перевод будет "я есть прозрачный", ха-ха..

все хуже..
яндекс:
Я ясно?
гугль:
Я ясно?

дословный перевод к устойчивым фразам НЕПРИМЕНИМ. без базы перевод невозможен. :an:
« Последнее редактирование: 04.06.11, 21:27:57 от Ra »
  №1 for detaling maniacs

Оффлайн LEO

  • Ветеран
  • *****
  • Сообщений: 4417
  • Карма: 310
  • Пол: Мужской
    • Просмотр профиля
ох, может и так. а может и найдется пример. что-то не тянет тыковку сейчас напрягать, может как-нибудь потом...

> дословный перевод к устойчивым фразам НЕПРИМЕНИМ. без базы перевод невозможен.
с этим не спорит никто.

однако использование словаря идиом превращает метод из статистического в гибридный.
года 3 назад на конференции гугла, посвященной этому переводчику, докладчика спросили, пробовали ли они такой гибридный подход. Он тогда ответил, что пробовали, но получилось еще хуже.

Возможно, сам метод нуждается в доработке (словарь идиом туда так просто не прикрутить, в отличие от классического метода)
В принципе, он должен перевести идиому нормально, если она состоит из постоянной группы слов, которая не используется (или используется крайне редко) для обозначения чего-либо другого (состоит из группы слов, которые не упортребляются "в прямом" смысле).
http://is.gd/fpTeSMПродам книжки про Ajax и ASP.NET, http://is.gd/lDL64HПриглашаю в Dropbox

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
Получилось хуже, потому что программисты делали. Персонал тоже гибридно надо было набирать на проект :ag:

Статистически человека, закрывающего грудью амбразуру не должно быть вообще. Но такие люди есть. Даже отсюда следует, что в общем тот более трудный путь был вернее.

Нельзя сказать, чтобы устойчивые фразы состояли из эксклюзивно сочетаемых в их слов, часто можно перевести и так и так.
Фишка в том, что идиоматических выражений заданное число, и если в контексте не упоминаются их маркеры то с 90% вероятностью надо переводить как есть, а если маркеры в налии - то наоборот, брать выражение из базы. Я б добавил еще кнопку перевод2 и перевод3, на случай если текст переведен криво и непонятен, перебор выражений или прямых переводов.
  №1 for detaling maniacs

Оффлайн macros

  • Старожил
  • ****
  • Сообщений: 357
  • Карма: 16
    • Просмотр профиля
Я б добавил еще кнопку перевод2 и перевод3, на случай если текст переведен криво и непонятен, перебор выражений или прямых переводов.
Нечто похожее у гугла есть. Например для "wet look" в вашем примере предлагает еще следующие варианты: мокрый вид, выглядел смоченным :-)

Оффлайн Нервный

  • Ветеран
  • *****
  • Сообщений: 7292
  • Карма: 285
  • Пол: Мужской
    • Просмотр профиля
Цитировать
Персонал тоже гибридно надо было набирать на проект

 Есть такая старая басня Крылова Ивана Андреевича о Лебеде, Раке и Щуке. У специалистов в различных предметных областях, должны быть точки соприкосновения и они должны друг друга понимать, только тогда будет успех. Если уж лингвист, то с навыками программирования, если программист то со знанием языков. Иначе получится, что лингвист будет требовать от программиста написать, грубо говоря, операционную систему за две недели (а ч0, Билл Гейтс-то написал), программист похихикает, и "напишет" линукс, в результате оба друг на друга будут показывать пальцем - "да он дурак, увольте его". Коллектив, в котором такая ситуация исключена, назвается "команда", и вот такой социум, создать сложнее всего. Тут "гибридно набирать на проект" недостаточно, нужны очень другие подходы.

 Проблема современного программного обеспечения состоит в том, что чаще всего, его пишут люди, не интересующиеся предметной областью в достаточной степени, и не понимающие острых моментов, решение которых нужно возложить на машину, но чрезмерно уделяющие внимание ненужным вещам. Нужен человек, интересующийся предметной областью и умеющий разрабатывать ПО. Не на любительством уровне, разумеется. Такой человек, наберёт себе нужную команду и многое сделает сам. Наберёт "гибридно" и как надо. Получается этот самый "незаменимый". Получается, что без них никак.

 Я искал программу для коллекционеров, с целью упорядочивания своей коллекции. Вообще ничего нет. Ни одной полуполезной функции в платном и бесплатном треше, не обнаружилось. Стал спрашивать у коллекционеров, а чем пользуетесь ? Самый продвинутый вариант - эксель, но тупо вбивание, с целью скорее распечатать и опубликовать, чем систематизировать, а самый распространённый - ручка-бумага-голова. Я начал систематизировать свою коллекцию с помощью программы, которую накатал за пару часов, но если взяться за развитие, то работы там на много лет. Такие дела. Не всё "написано до нас", есть огромное поле для деятельности, надо только увлечься чем-то, отличным от программирования и всех этих IT дел.
« Последнее редактирование: 20.06.11, 13:25:14 от Нервный »

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
светлая голова ) поддержу

а imdb.com попадает в список увлеченных своим делом каталогизации?
  №1 for detaling maniacs

Оффлайн Нервный

  • Ветеран
  • *****
  • Сообщений: 7292
  • Карма: 285
  • Пол: Мужской
    • Просмотр профиля
Цитировать
а imdb.com попадает в список увлеченных своим делом каталогизации?

 Вот это есть типичный пример постановки задачи человеком, который не интересуется предметной областью. Голова коллекционера работает совсем по-другому. Ему, скажем так, не особенно важно, что за запись. Он её не будет никогда слушать с вероятностью 90%. Для прослушивания, у него отобраны самые "ценные" записи, а коллекцию он слушать никому не даст. Коллекционеру важны такие вещи, как состояние носителя, наличие оригинальной упаковки, её состояние, издание... Что нужно коллекционеру от каталога ? Чтобы он пришёл, скажем, на барахолку, и быстро определил, есть ли у него такая запись. Если исключить память, помнящую 15.000 записей, то что ? Ставить её на проигрыватель ? Бред. Вколачивать в поиск название, исполнителя - тоже не очень эффективно (хотя и этой фукции, эффективно работающей - регулярные выражения, поиск по нескольким полям - в этих программах для коллекционеров, нет). Тонкий клиент должен работать на мобильном устройстве. Не нужна централизованная база. Точнее, она нужна, но только для помощи в идентификации. База записей нужна для каждого своя. Сейчас в коллекциях 10-30% дублей. Это я сам пришёл к такому выводу, разбирая их. Если их систематизировать, то можно выгадать место, упаковки, пополнить обменный фонд. Но бОльшую часть рутины должна брать на себя машина, вколачивать каталог ручками в компьютер, что предлагают существующие программы, возьмутся немногие. По одной фотографии, которую сделать с мобильного устройства очень просто и быстро, можно заполнить многие поля каталога с помощью машины в 90% случаев. В общем, долгая речь.
« Последнее редактирование: 21.06.11, 11:00:47 от Нервный »

Оффлайн Ser.

  • Ветеран
  • *****
  • Сообщений: 9206
  • Карма: 270
  • Пол: Мужской
    • Просмотр профиля
Такой каталог можно сделать на aces
Судя по вашему описанию, подойдет, например, не сильно переработанная система составления заказа по коллекциям одежды, например?, адидаса. Имеется ввиду программа заказа товара диллерами. Могу порыться гдет на винте валялось.
Бороться и искать, найти и перепрятать. (с)
Опыт позволяет нам ошибаться гораздо увереннее. (с)

Знайся только с достойными дружбы людьми,
С подлецами не знайся, себя не срами,
Если подлый лекарства нальет тебе - вылей!
Если мудрый подаст тебе яду - прими! (c)

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
зря ты это написал  :ag:
  №1 for detaling maniacs