Автор Тема: Переводчики Google vs. Yandex - эпический фэйл  (Прочитано 4127 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
оригинал

Duragloss FGPC (Fiberglass Polish & Cleaner) contains synthetic polymers, which form a protective coating on the surface of painted vehicles. It is durable to both acid and alkaline washes. Can be applied in the sun or shade to the entire vehicle before removing easily for a "wet look" shine and protective coating.

Google
Duragloss FGPC (стеклоткани польских и Cleaner) содержит синтетические полимеры, которые образуют защитный слой на поверхности окрашенных автомобилей. Он прочен как кислой и щелочной мойки. Может применяться на солнце или в тени на весь автомобиль, прежде чем снимать легко для "влажный взгляд" блеск и защитного покрытия.

Yandex
Duragloss FGPC (Стеклоткани Польский И экологически Чистые) содержит синтетических полимеров, которые образуют защитный слой на поверхности окрашенных транспортных средств. Она достаточно прочная, чтобы оба кислотных и щелочных моет. Может применяться на солнце или в тени, чтобы весь корабль до того, как легко для "мокрый вид" обуви и защитных покрытий.

шокирует, что англоязычный гугл не смог осилить слово Очиститель, а яндекс родил слова Экологически (откуда, пст!?) и Корабль (даже в карманном словарике так не лажают..)

влажный взгляд почти доконал


Откуда оба ресурса-миллиардера родили слово ОБУВЬ для меня вообще потрясающая загадка... :bt:

про слово Полироль, которое гандекс перевели как Польские вообще молчу.

и ведь кто-то ими переводит и даже бабло рубит на фрилансе  :bj:
  №1 for detaling maniacs


bear

  • Гость
это вполне нармально попробуй перевести правильно электрическим переводчиком оборот used to
пример: "Did you use to eat a lot sweet when you were a child?"
Правильный перевод: "Когда вы были ребенком вы обычно ели много сладкого?"
Google: "Использовали ли вы съесть много сладкого, когда вы были ребенком?"
Translate.ru: "Вы использовали, чтобы съесть много конфеты, когда Вы были ребенком?"

Некоторые обороты переводятся очень сложно из серии "Дэти это нэльзя понять, это нада запомнить",
плюс устоявшиеся выражения
плюс когда на одно слово приходят 5-7 значений да еще глаголов столькоже
пример - мой ник
bear - (сущ.) медведь
bear - (гл.) нести
пример предложения - I bear glass of water.

плюс еще и сложно составные слова
которые например начинаются на un-

ну и наконец, я вот сегодня переводил словосочетание "I'm-a blow stuff up"
правильное значение фразы нашел только тут: http://www.urbandictionary.com
даже знакомые бусурмани затруднились сходу сказать, как правильно перевести эту фразу

Оффлайн LEO

  • Ветеран
  • *****
  • Сообщений: 4417
  • Карма: 310
  • Пол: Мужской
    • Просмотр профиля
и яндекс и гугл используют статистический метод перевода.
опыта и ресурсов у гугла здесь намного больше.

использует ли сейчас промт классический метод, или перешел\добавил статистический - не знаю.

в любом случае, "задача машинного переода сводится в основном к тому, чтобы донести до пользователя основной смысл иностранного текста средней сложности." (к подчеркнутому - т.е. даже смысл не полностью, чего уж говорить о деталях)

я использовал гугл, когда делал задания по английскому. когда не знал, как перевести - смотрел, что предлагает гуглоперевод. как правило сразу находил ответ на свой вопрос - часто гугл предлагал очень удачные формулировки.
« Последнее редактирование: 02.06.11, 17:19:36 от LEO »
http://is.gd/fpTeSMПродам книжки про Ajax и ASP.NET, http://is.gd/lDL64HПриглашаю в Dropbox

Оффлайн SKyHC

  • Ветеран
  • *****
  • Сообщений: 2437
  • Карма: 266
  • Вониссимо
    • Просмотр профиля
Откуда оба ресурса-миллиардера родили слово ОБУВЬ для меня вообще потрясающая загадка... :bt:
Я не знаю, как оценить мою степень владения буржуйским, но смысл оригинала (за исключением пяти-шести слов) уловил слёту.

И слова "обувь" в гуглевском переводе не увидел.

Отсюда вывод: да гребись оно всё подохни мальчики и девочки, таки учите язык и не доверяйте роботам-переводчикам

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
это вполне нармально попробуй перевести правильно электрическим переводчиком оборот used to
пример: "Did you use to eat a lot sweet when you were a child?"
Правильный перевод: "Когда вы были ребенком вы обычно ели много сладкого?"
Google: "Использовали ли вы съесть много сладкого, когда вы были ребенком?"
Translate.ru: "Вы использовали, чтобы съесть много конфеты, когда Вы были ребенком?"

Некоторые обороты переводятся очень сложно из серии "Дэти это нэльзя понять, это нада запомнить",
плюс устоявшиеся выражения
плюс когда на одно слово приходят 5-7 значений да еще глаголов столькоже
пример - мой ник
bear - (сущ.) медведь
bear - (гл.) нести
пример предложения - I bear glass of water.

плюс еще и сложно составные слова
которые например начинаются на un-

ну и наконец, я вот сегодня переводил словосочетание "I'm-a blow stuff up"
правильное значение фразы нашел только тут: http://www.urbandictionary.com
даже знакомые бусурмани затруднились сходу сказать, как правильно перевести эту фразу

Вопрос не в этом. Вопрос в том, что имея миллиарды долларов, оба ресурса не в силах провести обычный копи-паст устойчивых фраз (идиом) из словарика среднего пошиба.
Думаю, при таком бабле работы на пару дней. Нанять "операторов ПК" не требует статистических методов.
Про самообучаемые системы я не говорю. Куды там. Просто пальцами по клаве потыкать раз пицот))))

Пс лео акой нах основной смысл если даже основной смысл Полироль был переведен как Польский - польский что, хрен? ))))) это основной смысл?
В топку. Тема не раскрыта ни яндексом ни гуглом.
Яндексу так вообще позорно - лучший русскоязычный.
  №1 for detaling maniacs

Оффлайн Ser.

  • Ветеран
  • *****
  • Сообщений: 9206
  • Карма: 270
  • Пол: Мужской
    • Просмотр профиля
блин :ag:
только сейчас догадался)) мне периодически письма от Китайцев приходят со всякими предложениями/приглашениями.. читаем всегда в слух потом час ржем...

а это они гуглой просто переводят))
Бороться и искать, найти и перепрятать. (с)
Опыт позволяет нам ошибаться гораздо увереннее. (с)

Знайся только с достойными дружбы людьми,
С подлецами не знайся, себя не срами,
Если подлый лекарства нальет тебе - вылей!
Если мудрый подаст тебе яду - прими! (c)

Оффлайн Cash

  • VIP
  • Ветеран
  • *****
  • Сообщений: 6674
  • Пол: Мужской
    • Просмотр профиля
Нам то мож и пофиг, перевел пару раз и забыл. А представляете каково им переводить на великий могучий, плюются небось похлеще нашего...
Неси, потыкаем ©Sin
Я даже у сина готов взять  :facepalm: ©Bruse
Тут таких д*****бов до*уя. Вот я к примеру ©Gato.
Изготовление дубликатов домофонных ключей (TM, Mifare, Em-Marine)

Оффлайн LEO

  • Ветеран
  • *****
  • Сообщений: 4417
  • Карма: 310
  • Пол: Мужской
    • Просмотр профиля
> оба ресурса не в силах провести обычный копи-паст устойчивых фраз (идиом) из словарика среднего пошиба.

ахха, а Вы, наверное, будете тем оператором, который для каждого конкретного запроса будет определять, переводить данное выражение как фразеологизм или буквально?  :bj:
« Последнее редактирование: 03.06.11, 08:36:29 от LEO »
http://is.gd/fpTeSMПродам книжки про Ajax и ASP.NET, http://is.gd/lDL64HПриглашаю в Dropbox

Оффлайн Нервный

  • Ветеран
  • *****
  • Сообщений: 7292
  • Карма: 285
  • Пол: Мужской
    • Просмотр профиля
Цитировать
Думаю, при таком бабле работы на пару дней. Нанять "операторов ПК" не требует статистических методов.

 А я думаю, что даже при таком бабле достаточное количество операторов ПК, нанять невозможно. Тем более, что человек, достаточно бегло и точно переводящий, и достаточно быстро печатающий, "оператором ПК" работать не пойдёт. Боюсь, что такие люди зарабатывают гораздо побольше большинства местных ораторов. Особенно, это касается некоторых востребованных языков.

Цитировать
Про самообучаемые системы я не говорю. Куды там.

 Вы хотите поговорить про самообучающиеся системы чтоли ? Любая символьная информация не может использоваться в самообущающихся системах. Самообучающиеся системы работают только с образами. За незнание этого, бьют по мягкой розовой попке студентиков. Такие дела. Моя нить, соединяющящая уши, перегревается при попытке прикинуть, какой размерности нужна нейросеть, чтобы хотябы начать пытаться её обучить навыкам перевода. Ну а Вы, конечно же, считаете, что уже есть кулибин, который за 2 бутылки водки вам напишет самообущающийся переводчик. Разумеется.

 На сегодня, есть только две организации, которым нужна наука : Google и Microsoft. Причём, если если Баллмер даёт больше публиковаться, но почти не применяет наработки учёных, работающих на него, в своих продуктах, то Ларри выжимает из людей, работающих на него, вообще всё - и знания и опыт. Поэтому его контора столь успешна и гораздо более перспективнее шаражки, в которую превратил Баллмер бизнес своего друга по общаге.
« Последнее редактирование: 03.06.11, 11:41:47 от Нервный »

bear

  • Гость
На сегодня, есть только две организации, которым нужна наука : Google и Microsoft. Причём, если если Баллмер даёт больше публиковаться, но почти не применяет наработки учёных, работающих на него, в своих продуктах, то Ларри выжимает из людей, работающих на него, вообще всё - и знания и опыт. Поэтому его контора столь успешна и гораздо более перспективнее шаражки, в которую превратил Баллмер бизнес своего друга по общаге.
не расстраивайся, есть слухи, что балмера попрут не смотря на рост компании во время его правления в 3 раза, ит индустрия правда в тоже время выросла в 12 раз (хотя это всего лишь слухи на счет того, что попрут)

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
набор устойчивых фраз - ограничен довольно сильно.
это только человеку не знающему глубоко несколько языков кажется что там скрыт какой-то резерв неизвестной информации.
тот же английский оперирует набором в 800 слов, остальное - украшения речи, которые г-н Мюллер в свое время свел в 40000 слов в одноименном словаре.
наш могучий, но в основном своими окончаниями, тоже лимитирован.
и что, 1 человек значит может составить словарь слов, и словарь фразеологизмов, а компании с многотысячным штатом не могут даже воспользоваться этими наработками, чтобы сделать 100-кратный прирост вариаций словосочетаний?
да это смешно.
  №1 for detaling maniacs

Оффлайн Fantomass

  • Старожил
  • ****
  • Сообщений: 626
  • Карма: 15
  • When you have to shoot...Shoot! Don't talk.
    • Просмотр профиля
Цитировать
На сегодня, есть только две организации, которым нужна наука : Google и Microsoft. Причём, если если Баллмер даёт больше публиковаться, но почти не применяет наработки учёных, работающих на него, в своих продуктах, то Ларри выжимает из людей, работающих на него, вообще всё - и знания и опыт. Поэтому его контора столь успешна и гораздо более перспективнее шаражки, в которую превратил Баллмер бизнес своего друга по общаге.

Нэрвный плюнул в Мелкософт?
Этот момент нужно запечатлеть в мраморе.

Цитировать
и что, 1 человек значит может составить словарь слов, и словарь фразеологизмов, а компании с многотысячным штатом не могут даже воспользоваться этими наработками, чтобы сделать 100-кратный прирост вариаций словосочетаний?

Интересно.
Я периодически пользовался надмозгами и до сих пор не видел ни одного работающего даже в примитивной степени корректно, когда в исходнике появляется фразеологизм. Даже в форме, взятой из словаря.

Whats fucking wrong?

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
потому что анализ текста делается пословно, а не по предложению или даже абзацу.
достаточно выйти за рамки слова, отметить по 2-3 маркера смысловых, и автоматом понимаешь, что будет употреблен фразеологизм или прямое словосочетание. проставить эти маркеры отсканировав хотя бы словарь фразеологизмов английского - работа пары тройки человек на полгода.
а анализаторы у поисковиков уже есть.

короче - этим организациям взять нужно не программеров, а лингвистов профессиональных. а может им это не надо.
  №1 for detaling maniacs

Оффлайн Fantomass

  • Старожил
  • ****
  • Сообщений: 626
  • Карма: 15
  • When you have to shoot...Shoot! Don't talk.
    • Просмотр профиля
Я tag думаю что ключ в последней фразе.
Потому как словарей по переводу устойчивых идиом - как грязи, в прикрутке же последних проволокой к надмозгу я не вижу большой проблемы.

Оффлайн Нервный

  • Ветеран
  • *****
  • Сообщений: 7292
  • Карма: 285
  • Пол: Мужской
    • Просмотр профиля
Цитировать
потому что анализ текста делается пословно, а не по предложению или даже абзацу.

 Вы хотябы представить себе можете, сколько всего всевозможных предложений, не говоря уже про абзацы ?

Цитировать
достаточно выйти за рамки слова, отметить по 2-3 маркера смысловых, и автоматом понимаешь, что будет употреблен фразеологизм или прямое словосочетание

Цитировать
и что, 1 человек значит может составить словарь слов, и словарь фразеологизмов, а компании с многотысячным штатом не могут даже воспользоваться этими наработками, чтобы сделать 100-кратный прирост вариаций словосочетаний?

 Хех. Человек и лица людей автоматом различает. А машина не может. Такие дела.
« Последнее редактирование: 03.06.11, 21:28:27 от Нервный »

Оффлайн Fantomass

  • Старожил
  • ****
  • Сообщений: 626
  • Карма: 15
  • When you have to shoot...Shoot! Don't talk.
    • Просмотр профиля
Нервный. ты знаешь что такое "устойчивая идиома"?

Мне так кажется ты или опять галаперидолом упоролся, или изображаешь из себя толстого тролля.

В первом случае следует просохнуть, во втором - прекратить лохматить бабушку. Во избежание.

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
Вы хотябы представить себе можете, сколько всего всевозможных предложений, не говоря уже про абзацы ?
Дим, я как раз представляю - ин.яз закончил :ag:
Поверь, их не много. 90% идиом на ин.язе студент за год осваивает тупым заучиванием. 10% даже носители языка не знают, что они означают..

Раньше думали что и запах компьютер не отличит. Оказалось запах состоит из молекул и их можно проанализировать. Тупым перебором вариаций. В аэропорту, быстро.

Раздражает, что методы анализа для перевода применяются, ярды вбухиваются, а тупое создание и наполнение ограниченным набором устойчивых фраз - нет. Любая система работает устойчиво в сочетании разных элементов. Фундаментальной базы данных-то почему нет? Может им кто платит, чтоб они этого не делали? Я тогда вообще удивляюсь, как словари оцифровали - аццкая работа надо полагать, бюджет банановой республики нужен, да?
« Последнее редактирование: 03.06.11, 21:39:36 от Ra »
  №1 for detaling maniacs

Оффлайн LEO

  • Ветеран
  • *****
  • Сообщений: 4417
  • Карма: 310
  • Пол: Мужской
    • Просмотр профиля
> потому что анализ текста делается пословно, а не по предложению или даже абзацу.
ну, чуть больше, чем по слову. рассчитываются условные вероятности в зависимости от окружения.

> достаточно отметить по 2-3 маркера смысловых, и автоматом понимаешь, что будет употреблен фразеологизм или прямое словосочетание.

не знаю, что за маркеры, но если они "смысловые" - то совершенно очевидно, что никакой ИИ их не распознает.
http://is.gd/fpTeSMПродам книжки про Ajax и ASP.NET, http://is.gd/lDL64HПриглашаю в Dropbox

Оффлайн Ra

  • ∴ Scharfschütze Θ
  • Ветеран
  • *****
  • Сообщений: 12206
  • Карма: 1680
  • Пол: Мужской
  • А вас я попрошу остаться.
    • Просмотр профиля
всего лишь слова маркеры

если "грабанули кассу" по тексту, то точно не "палец в пироге", а "доля в награбленном"  :ag:
вишь, одним маркером
а goondex написал бы "хрен засунул в пирог, экологически чистый"
да на одних поговорках можно было кардинально ситуацию с переводом вылечить))
  №1 for detaling maniacs

Оффлайн LEO

  • Ветеран
  • *****
  • Сообщений: 4417
  • Карма: 310
  • Пол: Мужской
    • Просмотр профиля
всего лишь слова маркеры

если "грабанули кассу" по тексту, то точно не "палец в пироге", а "доля в награбленном"  :ag:
вишь, одним маркером
а goondex написал бы "хрен засунул в пирог, экологически чистый"
да на одних поговорках можно было кардинально ситуацию с переводом вылечить))

а можно сначала in egnlish и выделить маркеры?)
http://is.gd/fpTeSMПродам книжки про Ajax и ASP.NET, http://is.gd/lDL64HПриглашаю в Dropbox