მთავარი ინოვაცია Google AI ახლა მომხმარებლებს საშუალებას აძლევს, მყისიერად თარგმნან ტექსტი 27 ენაზე სატელეფონო კამერებით

Google AI ახლა მომხმარებლებს საშუალებას აძლევს, მყისიერად თარგმნან ტექსტი 27 ენაზე სატელეფონო კამერებით

ᲠᲐ ᲤᲘᲚᲛᲘᲡ ᲡᲐᲜᲐᲮᲐᲕᲐᲓ?
 
(Gif: Google)

(Gif: Google)



ხელოვნური ინტელექტის წყალობით, უცხოეთში გამგზავრება არასოდეს ყოფილა უფრო მარტივი.

Google Translate აპი მომხმარებლებს საშუალებას აძლევს მყისიერად თარგმნონ ტექსტი. აპში, უბრალოდ მიუთითეთ კამერა ტექსტზე, რომლის თარგმნაც გსურთ და ნახავთ, რომ პირდაპირ ეთერში გადაიქცევა თქვენს სასურველ ენაზე - არ გჭირდებათ ინტერნეტი ან მობილური ტელეფონის მონაცემები. ეს მოსახერხებელი ფუნქცია უკვე გარკვეული დროიდან ხელმისაწვდომია, მაგრამ ის მხოლოდ შვიდი ენისთვის იყო თავსებადი. ახლა , მანქანური სწავლების წყალობით, Google- მა განაახლა აპი და 27 ენა დაუყოვნებლივ თარგმნა.

შემდეგ ჯერზე, როცა პრაღაში იქნებით და ვერ წაიკითხავთ მენიუს, ჩვენ უკან დავბრუნდით, - წერს კომპანიის კვლევის შესახებ ოტავიო გუდმა, Google– ის პროგრამული უზრუნველყოფის ინჟინერმა ბლოგი .

Google- მა ასევე გამოიყენა AI, რომ მეტყველების ამოცნობის შეცდომები გაანახევრა.

დღეის მდგომარეობით, ინგლისურ, ფრანგულ, გერმანულ, იტალიურ, პორტუგალიურ, რუსულ და ესპანურ ენებზე თარგმნის გარდა, შემდეგი 20 ენების თარგმნა შესაძლებელია რეალურ დროშიც: ბულგარული, კატალანური, ხორვატული, ჩეხური, დანიური, ჰოლანდიური, ფილიპინური, ფინური, უნგრული, ინდონეზიური, ლიტვური, ნორვეგიული, პოლონური, რუმინული, სლოვაკური, შვედური, თურქული და უკრაინული. თუ ტექსტის პირდაპირ ეთერში ყურების ნაცვლად სურათის გადაღება გსურთ, სულ 37 ენაა მხარდაჭერილი.

როგორ შეძლო Google- მა ხელმისაწვდომი ენების რაოდენობა? მათ პირველად შეიძინეს Word Lens, რომელიც ადრე იყო გაფართოებული რეალობის თარგმანის პროგრამა და გამოიყენეს მანქანური სწავლება და კონვოლუციური ნერვული ქსელები აპის შესაძლებლობების გასაზრდელად. მნიშვნელოვანი იყო მიღწევები სურათის ამოცნობაში.

ხუთი წლის წინ, თუ კომპიუტერს ანიჭებდით კატის ან ძაღლის გამოსახულებას, მას უჭირდა ეთქვა რომელი რომელი. კონვოლუციური ნერვული ქსელების წყალობით, კომპიუტერს არა მარტო შეუძლია განსხვავება კატებსა და ძაღლებს შორის, მათ ძაღლების სხვადასხვა ჯიშის ამოცნობაც კი შეუძლიათ, თქვა მისტერ გუდმა. დიახ, ისინი კარგია, ვიდრე მხოლოდ trippy ხელოვნება - თუ თარგმნით უცხოურ მენიუს ან ხელს აწერთ Google– ის Translate აპლიკაციის უახლეს ვერსიას, ახლა იყენებთ ღრმა ნერვულ ქსელს.

Ნაბიჯ - ნაბიჯ

Პირველი , თარგმანმა უნდა ამოიღოს ფონური უწესრიგობა და იქონიოს ტექსტი. როდესაც იგი იმავე ფერის პიქსელების ბლოკებს პოულობს, ის განსაზღვრავს მათ ასოებს. როდესაც ეს ბლოკები ერთმანეთთან ახლოს არის, ესმის, რომ ეს უწყვეტი ხაზია, რომელიც უნდა წაიკითხო.

შემდეგი, აპლიკაციამ უნდა აღიაროს რა არის თითოეული ასო. აქ შემოდის ღრმა სწავლა.

ჩვენ ვიყენებთ კონვოლუციურ ნერვულ ქსელს, ვავარჯიშებთ მას ასოებსა და არაწერებზე, რათა მან შეძლოს გაიგოს, თუ როგორ გამოიყურება სხვადასხვა ასოები.

მკვლევარებს პროგრამული უზრუნველყოფის მომზადება მოუწიათ არა მხოლოდ სუფთა, არამედ ბინძური ასოების გამოყენებით. მისტერ გუდმა დაწერა, რომ რეალურ სამყაროში გამოგზავნილი წერილები აისახება ანარეკლებით, ჭუჭყით, ლაქებით და ყველანაირი უცნაურობით. ასე რომ, ჩვენ ავაშენეთ ჩვენი ასოების გენერატორი ყველანაირი ყალბი ჭუჭყის შესაქმნელად, რათა დამაჯერებლად მიმეძგერებინა რეალური სამყაროს ხმაური - ყალბი ანარეკლი, ყალბი ლაქები, ყალბი უცნაურობა. Ზოგიერთი

ზოგიერთი ბინძური ასო გამოიყენება ტრენინგისთვის. (ფოტო: Google)








მესამე ნაბიჯი ეძებს აღიარებულ ასოებს ლექსიკონში თარგმანის მისაღებად. სიზუსტის დამატებით მცდელობისთვის, ლექსიკონის ძიება სავარაუდოა, თუ S არასწორად არის წაკითხული, როგორც 5.

დაბოლოს, ნათარგმნი ტექსტი გადმოცემულია ორიგინალის თავზე იმავე სტილში.

ამის გაკეთება შეგვიძლია, რადგან სურათზე უკვე აღმოვაჩინეთ და წავიკითხეთ ასოები, ამიტომ ზუსტად ვიცით, სად არიან ისინი. ჩვენ შეგვიძლია დავაკვირდეთ ასოების მიმდებარე ფერს და გამოვიყენოთ ეს ორიგინალი ასოების ამოსაშლელად. ამის შემდეგ, ჩვენ შეგვიძლია დავხატოთ თარგმანი თავდაპირველი ფონის ფერის გამოყენებით, ნათქვამია ბლოგის პოსტში.

იმისათვის, რომ მაქსიმალურად ეფექტური იყოს და ყველა ეს ნაბიჯი რეალურ დროში დასრულდეს ინტერნეტისა და მონაცემთა კავშირის გარეშე, Google– ის გუნდმა შექმნა ძალიან მცირე ნერვული ქსელი, რომლის ზედა ზღვარია ინფორმაციის სიმკვრივით. ვინაიდან ისინი ქმნიდნენ თავიანთ ტრენინგის მონაცემებს, მნიშვნელოვანი იყო სწორი მონაცემების შეტანა, მაგრამ არაფერი დამატებით, ასე რომ ნერვული ქსელი არ იყენებს ინფორმაციის სიმკვრივის დიდ ნაწილს უმნიშვნელო საგნებზე. მაგალითად, თუ როგორ სჭირდება ასო უნდა აღიაროს მცირედი ბრუნვით, მაგრამ არა ძალიან ბევრი.

საბოლოოდ, მომხმარებლებს კიდევ 20 ენა რჩებათ, მაგრამ იგივე სწრაფი სიჩქარე აქვთ.

აგრეთვე იხილეთ: Google– ის AI– ს გუნდმა მოგვაწოდა მათი მანქანური სწავლების კვლევის დაბალი მაჩვენებელი

ᲡᲢᲐᲢᲘᲔᲑᲘ, ᲠᲝᲛᲚᲔᲑᲘᲪ ᲨᲔᲘᲫᲚᲔᲑᲐ ᲛᲝᲒᲔᲬᲝᲜᲝᲗ :