ئىزدەخەۋەر > پەن- تېخنىكا >
بەيدۇ سۈنئىي ئىدراكى گېپىڭىزنى يېرىم سائەت ئاڭلىسىلا سىزدەك سۆزلىيەلەيدۇ
مەنبە : نۇر تورى
2017-05-30 17:05:47


سۈنئىي ئىدراكنىڭ قىلالايدىغان ئىشلىرى بارغانسېرى كۆپەيدى، مەسىلەن سۈرەتنى پەرقلەندۈرۈش، تەبىئىي تىلنى چۈشىنىش، يەنە قورشاۋ شاھمات ئويناش قاتارلىق. ئەلۋەتتە، قورشاۋ شاھمات ماھىرلىرىمۇ ئاللىقاچان ئۇنىڭ بىلەن مۇسابىقىلىشىشنى خالىماس بولۇپ قالدى، چۈنكى سۈنئىي ئىدراك ئەزەلدىن خاتا ئۇرۇق ماڭمايدۇ، تېخى يېقىندىلا گۇگول سۈنئىي ئىدراكلىق ماشىنا ئادىمى AlphaGoغا ئۈچ مەيدان تولۇق يېڭىلگەن مەشھۇر شاھمات ماھىرى كې جيېنىڭ سۆزى بويىچە ئېيتقاندا «سۈنئىي ئىدراك بىلەن شاھمات ئويناش تولىمۇ ئازابلىق ئىش، چۈنكى ئۇ بەكلا مۇكەممەل.»

گۇگولنىڭ سۈنئىي ئىدراكى قورشاۋ شاھمات ئويناۋاتقاندا، بەيدۇ داۋاملىق تاۋۇش ۋە سۈرەت پەرقلەندۈرۈش ساھەسىدە تېپچەكلىمەكتە.
بەيدۇ ئىلگىرى SwiftScribe («تېز خاتىرىلەش» دېگەن مەنىدە) ئىسىملىك بىر يۇمشاق دېتالنى بازارغا سالغان ئىدى، ئۇ تاۋۇشنى خەتكە ئايلاندۇرالايتتى. ئەمەلىيەتتە بەيدۇ تەتقىق قىلغان يەنە بىر سۈنئىي ئىدراك خەتنى سۆزگە ئايلاندۇرالايدۇ، ئۇنىڭ ئىسمى Deep Voice. خەۋەرگە ئاساسلانغاندا، بۇ سۈنئىي ئىدراكنىڭ گەپ قىلىشى ھەقىقىي ئادەم بىلەن پەرقلەنمەيدىكەن، شۇنداقلا تېزلىكتە ئىنكاسمۇ قايتۇرالايدىكەن. بىراق بۇ سىستېما بىر قېتىمدا پەقەت بىر خىل ئاۋاز ئۆگىنەلەيدىكەن، ئۇنىڭ ئۈستىگە ئۆگىنىش ئۈچۈن بىرنەچچە سائەت، ھەتتا ئۇنىڭدىنمۇ جىق ۋاقىت كېتىدىكەن.
يېقىندا بەيدۇ بۇ يۇمشاق دېتالنىڭ دەرىجىسىنى ئۆستۈرۈپ، Deep Voice 2نى ئېلان قىلدى، ئۇ يېرىم سائەتلىك ئاۋاز چاستوتىسىغا تايىنىپ، بىر ئادەمنىڭ ئاۋازىنى ئىنچىكە پەرقلىرىگىچە ئۆگىنەلەيدىكەن، ئۇنىڭ ئۈستىگە بۇ سىستېما يۈزلىگەن تەلەپپۇزنى ئۆگىنىپ، يەنە نەچچە يۈز ئادەمنىڭ سۆزلىشىنى دورىيالايدىكەن.
The Verge مۇنداق دېدى: ئەمەلىيەتتە ئالمىنىڭ سۈنئىي ئىدراكلىق ئاۋازلىق ياردەمچىسى Siriمۇ رايون خاراكتېرلىك تەلەپپۇزنى دورىيالايدۇ. Siriنىڭ بۇنى ئۆگىنىشكە سەرپ قىلىدىغان ۋاقىتى ئاز ئەمەس، چۈنكى بىر خىل يېڭى ئاۋاز ۋە تەلەپپۇزنى ئۆگىنىش ئۈچۈن بىر ئادەمنىڭ مىڭ سائەتلىك ئاۋازى لازىم بولىدۇ. ئاندىن كېيىن ئېنژىنېرلارنىڭ يەنە ئازراق ۋاقىت سەرپ قىلىپ كۆندۈرۈشىگە، قانداق سۆزلەشنى ئۆگىتىشىگە توغرا كېلىدۇ.
Deep Voice 2نىڭ مەشغۇلات ئۇسۇلى سەل ئوخشىمايدۇ، ئۇ ئالدى بىلەن نەچچە يۈز كىشىنىڭ گەپ قىلىش داۋامىدىكى ئورتاقلىقىنى ئۆگىنىپ، ئىنسانلارنىڭ گەپ قىلىشتىكى ئاساسىي مودېلىنى قۇرىدۇ، ئاندىن كېيىن، ئوخشاش بولمىغان ئادەمنىڭ گەپ قىلىش ئالاھىدىلىكى، سۆز ئۇرانى، تەلەپپۇزىغا ئاساسەن بۇ مودېلنى تەڭشەپ تۇرىدۇ. بۇ سىستېمىنى ئادەمنىڭ تەڭشىشى ھاجەتسىز.

«ئۇنىڭغا توغرا سانلىق مەلۇمات بېرىلسىلا، ئۇ ئۆزى نېمە ئالاھىدىلىكنىڭ مۇھىملىقىنى ئۆگىنىدۇ.» بۇ تۈرگە مەسئۇل بەيدۇنىڭ كىرىمنىي جىلغىسى تەجرىبىخانىسىدىكى ئالىم ئاندىرى گىبىيانسكىي (Andrew Gibiansky) شۇنداق دەيدۇ.

بۇ ئوخشىمىغان ئادەمنىڭ گەپ قىلىشىنى دورايدىغان ئىقتىدارنىڭ نېمە كېرىكى بار؟
بەيدۇنىڭ قارىشىچە، بۇنداق تېخنىكا ئەقلىي ئاۋازلىق ياردەمچىگە قوللىنىلىشى مۇمكىن ئىكەن، ئابۇنت ئاۋاز ئارقىلىق ئاۋازلىق ياردەمچى بىلەن پىكىر ئالماشتۇرسا ياكى بۇيرۇق چۈشۈرسە بولىدىكەن، ئاۋازلىق ياردەمچىمۇ ئاۋازلىق توغرا جاۋاب بېرىدىكەن. ئەگەر ھەر بىر ئاۋازلىق ياردەمچىنىڭ ئوخشىمىغان ئاۋازى بار بولسا، خاسلىق تۇيغۇسى تېخىمۇ كۈچىيىدۇ، Siriغا ئوخشاش بىر خىللا بولۇپ قالمايدۇ.
ھازىر ئىشقا بېرىش يولىدا نۇرغۇن كىشىلەر ئېلكىتاب ئاڭلاشنى ياخشى كۆرىدۇ، بۇمۇ بىر خىل قوللىنىشقا بولىدىغان ساھە، بۇ تېخنىكا بولسىلا، سىز ئېلكىتاب ئاڭلىغان چاغدا، ئىچىدىكى ھەربىر پېرسوناژنىڭ ئۆزىنىڭ ئاۋازى ۋە مۇناسىپ كەيپىياتى، سۆز ئۇرانى بولىدۇ، بۇنداق ئاڭلىغاندا تېخىمۇ جانلىق بولىدۇ.
ئەمەلىيەتتە بۇنداق تېخنىكا يەنە ئاۋازلىق ئابۇنتلار مۇلازىمىتىدە ئىشلىتىلسە بولىدۇ. ئىگىلىنىشىچە، بەيدۇنىڭ ئىچكى قىسمىدىمۇ مەخسۇس ئاۋازلىق ئابۇنتلار مۇلازىمىتى كوللېكتىپى بار ئىكەن. بۇندىن بۇرۇن بەيدۇ بىرلەشمە خەۋەرلىشىش بىلەن ھەمكارلىق كېلىشىمى ئىمزالىغان، لى يەنخۇڭنىڭ ئېيتىشىچە، كەلگۈسىدە بىرلەشمە خەۋەرلىشىش شىركىتىگە ياردەم قىلىپ بىر ئەقلىي ئابۇنىتلار مۇلازىمىتى بەرپا قىلىدىكەن. لى يەنخۇڭ مۇنداق دېدى: «سۈنئىي ئىدراك بىز ئۈچۈن قىممەت تولۇقلايدىغان، يۈرۈشلۈك مۇلازىمەتلەرنى ئالماشتۇرىدىغان كەلگۈسى بەلكىم ئاللىقاچان يېقىنلاپ كەلدى.» بۇنىڭدىن ئىلگىرى بەيدۇ دۇنيا يىغىندا، لى يەنخۇڭ يەنە ئاۋاز تونۇش تېخنىكىسىنىڭ يەنە بىر ئەمەلىي قوللىنىلىش ئورنىنى كۆرسەتتى: تېلېفوندا مال سېتىش. ئەگەر تېلېفون ئابۇنىتلار مۇلازىمىتى ھەر قېتىم تېلېفون قىلغاندا، گەپ قىلغان ئادەمنىڭ تەلەپپۇزى ۋە سۆز ئورانى ئوخشاش بولمىسا، تېخىمۇ راست ئادەمگە ئوخشايدۇ.
ئۇندىن باشقا، ئىشلىتىپ باققانلار ئاۋازلىق يول باشلاش سېستىمىسىدا ئوخشاش بولمىغان ئاۋاز بولىقىنىڭ بارلىقىنى بىلىدۇ، ئەگەر يۇقىرىقى گەپ قىلىشنى ئۆگىنىدىغان ئىقتىدار بار بولسا، سىز پەرزەنتلىرىڭىز ياكى سۆيگۈنىڭىزگە ئاۋاز بولىقىنى ئۈنگە ئالدۇرسىڭىز بولىدۇ، ئەگەر مەلۇم داڭلىق چولپاننى ياخشى كۆرسىڭىز، سىز ئۇنىڭ ناخشىلىرىنى، زىيارەت ياكى نۇتۇق ئاۋازىنى توردىن چۈشۈرۈپ، ئاندىن سۈنئىي ئىدراكقا ئۆگەتسىڭىز بولىدۇ. شۇنىڭ بىلەن سىزگە يول باشلايدىغىنى، سىز ئەڭ ياخشى كۆرىدىغان ئادەمنىڭ ئاۋازى بولىدۇ.
ئەمدى باشقا شىركەتلەرنىڭ بۇ ساھەدە نېمىلەرنى قىلىۋاتقانلىقىغا قاراپ باقايلى.
بەيدۇ بۇ ساھەدە ئىزدىنىۋاتقان بىردىنبىر ماگنات ئەمەس، بۇلتۇر 9-ئايدا، گۇگولنىڭ DeepMind كوللېكتىپى بىر خىل ئاۋاز بىرىكتۈرگۈچ WaveNetنى ئېلان قىلغان بولۇپ، بۇ يۇمشاق دېتالنىڭ ئاۋاز سۈپىتى ئەنئەنىۋى ئاۋاز بىرىكتۈرۈش سىستېمىسىغا قارىغاندا ناھايىتى زور دەرىجىدە يۇقىرى كۆتۈرۈلگەن.
بۇ ساھەدە يەنە نۇرغۇن ئىگىلىك تىكلەش شىركەتلىرى بار. ئۆتكەن ئايدا كانادادىكى ئىگىلىك تىكلەش شىركىتى Lyrebird بىر يېڭى سىستېمىنى ئېلان قىلغان بولۇپ، ئۇ بىر مىنۇتلۇق ئاۋاز سانلىق مەلۇماتى ئارقىلىق، نۇرغۇن چوڭ ئەربابلارنىڭ گەپ قىلىشىنى دورىيالايدىكەن.
ھازىر بۇ كەسىپ ئىنتايىن تەرەققىي قىلدى، ئۇنىڭ ئۈستىگە سۈنئىي ئىدراك ئىنسانلار بىلەن بېرىش-كېلىش قىلىشنى تەدرىجىي ئۆگىنىۋاتىدۇ، كېيىن تېلفونىستلارلا ئەمەس، بەلكىم ئاۋازى گۈزەل رادىيو دىكتورلىرىمۇ ئىشسىز قېلىشى مۇمكىن.



...

تولۇق مەزمۇنى: بۇ يەرنى چىكىڭ!

wiki.izda.com
izda

كۆپ كۆرۈلگەن خەۋەرلەر

  • 01
  • 01

ئۈستىگە قايتىش