Home នយោបាយ / Politic “យើងប្រហែលជាកំពុងហោះហើរពិការភ្នែក”៖ AWS ចង់ដោះស្រាយបញ្ហារបស់ភ្នាក់ងារ AI ដែលវង្វេងចេញពីការងារ

“យើងប្រហែលជាកំពុងហោះហើរពិការភ្នែក”៖ AWS ចង់ដោះស្រាយបញ្ហារបស់ភ្នាក់ងារ AI ដែលវង្វេងចេញពីការងារ

21
0



Anoop Deoras ប្រធានផ្នែកវិទ្យាសាស្ត្រអនុវត្តសម្រាប់ភ្នាក់ងារ AI នៅ Amazon Web Services មិនងាយនឹងមានការជូនដំណឹងទេ។ ទោះជាយ៉ាងណាក៏ដោយ នៅពេលត្រូវបានសួរថាតើមានអ្វីកើតឡើងនៅពេលដែលភ្នាក់ងារ AI ត្រូវបានប្រើប្រាស់នៅក្នុងការផលិតដោយគ្មានរបាំងការពារត្រឹមត្រូវ ការឆ្លើយតបរបស់គាត់គឺមិនមានភាពប្រាកដប្រជានោះទេ។

គាត់បាននិយាយថា “ប្រសិនបើគ្មានវាទេ” យើងអាចនឹងហោះហើរដោយងងឹតងងុល។ ហើយខ្ញុំព្រួយបារម្ភអំពីរឿងនោះដោយខ្លួនឯង។

ការអត្ថាធិប្បាយនេះកើតឡើងនៅពេលដែល AWS រៀបចំចេញនូវអ្វីដែលអាចជាឯកសារស្រាវជ្រាវដែលរិះគន់ខ្លួនឯងច្រើនបំផុតពីអ្នកផ្តល់សេវាពពកដ៏ធំនៅឆ្នាំនេះ។ នៅក្នុងការសិក្សាដែលបានចេញផ្សាយកាលពីថ្ងៃច័ន្ទ អ្នកវិទ្យាសាស្ត្រ Amazon Gaurav Gupta និង Vatshank Chaturvedi ចងក្រងឯកសារលម្អិតអំពីបច្ចេកទេសថាហេតុអ្វីបានជាភ្នាក់ងារ AI មានទំនោរទៅរកភាពវៃឆ្លាតខ្លួនឯង – ហើយហេតុអ្វីបានជាការដោះស្រាយបញ្ហាតម្រូវឱ្យគិតឡើងវិញនូវស្រទាប់កម្មវិធីទាំងមូលរវាងម៉ូដែល និងឧបករណ៍របស់វា។

ពេលវេលាគឺគួរឱ្យកត់សម្គាល់។ Amazon គឺជាម្ចាស់ជើងឯកសាជីវកម្មដ៏ឈ្លានពានបំផុតនៃការទទួលយក AI ក្នុងឆ្នាំកន្លងទៅ ដែលជាការជំរុញមួយដែលមិនបានសម្រេចនៅពេលដែលបុគ្គលិកត្រូវបានគេរាយការណ៍ថាចាប់បានដោយប្រើប្រាស់ភ្នាក់ងារ AI សម្រាប់ការងារគ្មានន័យ ដើម្បីកើនឡើងនៅក្នុងចំណាត់ថ្នាក់ផលិតភាពដែលបង្កើតដោយបុគ្គលិកហៅថា KiroRank ពេលវេលាហិរញ្ញវត្ថុ. Amazon បានបិទ KiroRank នៅថ្ងៃទី 29 ខែឧសភា ហើយ Amazon បានប្រកាសអំពីរឿងនេះ ទ្រព្យសកម្ម ថា​វា​មាន​តែ​ក្នុង​ទម្រង់​បែតា​ប៉ុណ្ណោះ ហើយ​ប្រើ​ដោយ​បុគ្គលិក​មួយ​ចំនួន​ប៉ុណ្ណោះ​មុន​ពេល​វា​ត្រូវ​បាន​បិទ។ ជាទូទៅ ក្រុមហ៊ុននិយាយថា ខ្លួនវាស់វែងការប្រើប្រាស់សញ្ញាសម្ងាត់ ដើម្បីស្វែងយល់ពីគំរូតម្លៃ និងប្រសិទ្ធភាព ប៉ុន្តែណែនាំប្រឆាំងនឹងការប្រើប្រាស់និមិត្តសញ្ញា ដើម្បីវាស់ស្ទង់ផលិតភាពរបស់អ្នកអភិវឌ្ឍន៍។

ទ្រព្យសកម្ម បានរាយការណ៍អំពីការដួលរលំទូទៅនៃយុគសម័យ tokenmaxxing ក្នុងសប្តាហ៍តែមួយ។ ក្រុមអ្នកស្រាវជ្រាវ AWS ដែលធ្វើការងារនេះមុនពេល KiroRank បិទបានអះអាងថាបញ្ហានៃការវាស់ស្ទង់ហ្គេមមានជម្រៅជ្រៅជាងគ្រាន់តែជាតារាងពិន្ទុរបស់ក្រុមហ៊ុន។

ការស្រាវជ្រាវផ្តោតលើពាក្យ benchmaxing ដែលជាការអនុវត្តនៃការបង្កើនលទ្ធផលគោល AI មិនមែនតាមរយៈគំរូដែលប្រសើរជាងមុននោះទេ ប៉ុន្តែតាមរយៈការកំណត់រចនាសម្ព័ន្ធម៉ាស៊ីនមេកាន់តែប្រសើរ។ អ្នកស្រាវជ្រាវបានរកឃើញថា កត្តាដូចជាភាពអាចជឿជាក់បាននៃ backend inference, network bandwidth កំឡុងពេលដំឡើងកម្មវិធី និងការកំណត់គោលការណ៍អស់ពេលអាចមានឥទ្ធិពលលើលទ្ធផលពី 5 ទៅ 10 ភាគរយ អ្នកស្រាវជ្រាវបានរកឃើញ ដោយមិនគិតពីអ្វីដែលគំរូមូលដ្ឋានអាចធ្វើបាននោះទេ។

Deoras បាននិយាយថា “ស្តង់ដារបច្ចុប្បន្នគឺមានភាពផុយស្រួយខ្លាំងណាស់” ទ្រព្យសកម្ម. “ការគ្រប់គ្រងមិនត្រឹមត្រូវនៃស្តង់ដារហេដ្ឋារចនាសម្ព័ន្ធទាំងនេះនឹងមិននាំមកនូវប្រាក់ចំណេញដល់អ្នកទេ ឬផ្ទុយទៅវិញ ប្រាក់ចំណេញនឹងមិនពិតទេ ពីព្រោះនៅក្នុងផលិតកម្មពិតប្រាកដនឹងមានដែនកំណត់ដែលអ្នកត្រូវគោរព។”

ភាពស្របគ្នាជាមួយ KiroRank មិនមែនជារឿងចៃដន្យទេ។ ក្នុងករណីទាំងពីរ (ចំនួននិមិត្តសញ្ញាហ្គេមរបស់និយោជិត ការកំណត់ហេដ្ឋារចនាសម្ព័ន្ធហ្គេមរបស់ក្រុមហ៊ុន) រង្វាស់បានផ្លាស់ប្តូរឆ្ងាយពីអ្វីដែលវាមានបំណងវាស់វែង។ ច្បាប់របស់ Goodhart ចែងថាវិធានការណាមួយឈប់ជាវិធានការមានប្រយោជន៍ នៅពេលដែលវាក្លាយជាគោលដៅ ហើយត្រូវបានអនុវត្តពីរដងក្នុងកម្រិតពីរផ្សេងគ្នានៃក្រុមហ៊ុនតែមួយ។ ទោះជាយ៉ាងណាក៏ដោយ Deoras មានការប្រុងប្រយ័ត្នក្នុងការបែងចែក benchmaxxing ពី tokenmaxxing ។

គាត់បាននិយាយថា “Token maxxing គ្រាន់តែមានន័យថាការដុតសញ្ញាសម្ងាត់ដើម្បីបំពេញកិច្ចការដែលពិតជាមិនត្រូវការ ប៉ុន្តែគ្រាន់តែដើម្បីកែលម្អចំណាត់ថ្នាក់របស់អ្នកនៅលើតារាងពិន្ទុប៉ុណ្ណោះ”។ ម៉្យាងវិញទៀត Benchmaxing គឺនិយាយអំពីលក្ខខណ្ឌរចនាសម្ព័ន្ធដែលឧស្សាហកម្មទាំងមូលវាយតម្លៃដោយខ្លួនឯង ហើយការសិក្សាបានអះអាងថាលក្ខខណ្ឌទាំងនេះត្រូវបានគ្រប់គ្រងជាប្រចាំ ឬមិនអើពើ។

ទោះបីជាយ៉ាងណាក៏ដោយ ការរកឃើញកាន់តែទូលំទូលាយនៃការស្រាវជ្រាវ ទាក់ទងនឹងអ្វីដែលកើតឡើងនៅក្នុងភ្នាក់ងារ នៅពេលដែលពួកគេត្រូវបានដាក់ពង្រាយ។ ការសិក្សាកំណត់នូវអ្វីដែលអ្នកនិពន្ធហៅថា គម្លាតនៃការប្រតិបត្តិដោយចេតនា៖ ការបរាជ័យនៅចំណុចប្រទាក់រវាងគំរូ AI និង “ខ្សែរកម្មវិធី” ដែលអនុវត្តការណែនាំរបស់វា។ Deoras បានពន្យល់អំពីខ្សែដែលជាប្រព័ន្ធប្រតិបត្តិការដែលស្ថិតនៅលើកំពូលនៃគំរូភាសា៖ “ខួរក្បាល” ដែលភ្ជាប់ទៅនឹងគំរូដើម្បីបង្កើតលទ្ធផលភ្នាក់ងារត្រឹមត្រូវ។

ការទុកអោយភ្នាក់ងារគិតយូរពេកដោយមិនពិនិត្យមើលបរិយាកាសជាក់ស្តែង ធ្វើអោយបញ្ហាកាន់តែធ្ងន់ធ្ងរ។ ពួកគេបង្កើតការសន្មត់ផ្ទៃក្នុងអំពីស្ថានភាពនៃប្រព័ន្ធដែលខុសពីការពិត ហើយចេញការបញ្ជាទិញដោយផ្អែកលើការសន្មត់ទាំងនោះ។ ខ្សែសង្វាក់នៃការគិតកាន់តែវែង វាកាន់តែទៅមុខ។

នៅពេលត្រូវបានសួរថាតើមនុស្សធ្វើអន្តរាគមន៍នៅក្នុងខ្សែដើម្បីការពារភ្នាក់ងារមិនឱ្យវង្វេងទេ Deoras បានឆ្លើយថា “បាទ / ចាស” ។ គាត់បាននិយាយថា មនុស្សនៅក្នុងរង្វិលជុំគួរតែជាមនុស្សដែលយល់ពីអ្វីដែលខុស នៅពេលដែលភ្នាក់ងារត្រូវបានដាក់ពង្រាយ “ហើយនោះជាការងាររបស់អ្នកវិទ្យាសាស្ត្រដែលរចនាភ្នាក់ងារ” គាត់បាននិយាយថា។ ប៉ុន្តែ​ពេល​និយាយ​ដល់​អ្នក​ដែល​ជា​អ្នក​ប្រើ​ប្រាស់ យើង​មិន​ចង់​លើស​លប់​ពួក​គេ​ទេ»។

ដំណោះស្រាយ Deoras អះអាងថា គឺជាប្រអប់ខ្សាច់៖ បរិយាកាសដែលត្រូវបានគ្រប់គ្រង ដែលភ្នាក់ងារអាចសាកល្បងសម្មតិកម្ម បរាជ័យដោយសុវត្ថិភាព និងធ្វើការកែតម្រូវវគ្គសិក្សា មុនពេលធ្វើសកម្មភាពដែលប៉ះពាល់ដល់ប្រព័ន្ធផលិតកម្ម។

គាត់បាននិយាយថា “ប្រសិនបើអ្នកមិនមានប្រអប់ខ្សាច់នោះទេ” គាត់បាននិយាយថា “ភ្នាក់ងារនឹងធ្វើសកម្មភាពបែបអភិរក្ស ឬធ្វើសកម្មភាពដែលយើងគិតថាមានគ្រោះថ្នាក់ខ្លាំងក្នុងរយៈពេលវែង”។

ភាពស្រដៀងគ្នាដែលគាត់បានគូរគឺវិស្វកម្មផ្នែកទន់ដែលទទួលខុសត្រូវ – បរិស្ថានអភិវឌ្ឍន៍ និងបំពង់សាកល្បងមុនពេលផលិត ដែលតែងតែមានដើម្បីចាប់កំហុស មុនពេលពួកវាទៅដល់អ្នកប្រើប្រាស់។ លោក​អះអាង​ថា ភ្នាក់ងារ​ទាមទារ​ហេដ្ឋារចនាសម្ព័ន្ធ​ដូច​គ្នា។

គាត់បាននិយាយថា “យើងពិតជាកំពុងនិយាយអំពីវិធីសុវត្ថិភាពដើម្បីសាកល្បងលក្ខណៈពិសេសមួយ មុនពេលវាចូលទៅក្នុងការផលិត” ។ “នោះហើយជាទាំងអស់។”

តាមរបៀបមួយ វាជាមេរៀនដូចគ្នាដែល KiroRank បានបង្រៀននៅកម្រិតអង្គការ ដែលឥឡូវនេះបានអនុវត្តចំពោះម៉ាស៊ីនខ្លួនឯង៖ បើគ្មាន guardrails ប្រព័ន្ធបង្កើនប្រសិទ្ធភាពសម្រាប់អ្វីដែលខុស។ ភាពខុសប្លែកគ្នានោះគឺថាភ្នាក់ងារដែលកំពុងពិការភ្នែកក្នុងផលិតកម្មគឺពិបាកនឹងដកចេញជាងតារាងពិន្ទុ។

អ្វី​ដែល​ការ​លើក​ឡើង​យ៉ាង​ទូលំទូលាយ​របស់​ការ​សិក្សា​ធ្វើ​ឱ្យ​ច្បាស់​គឺ​ការ​ចោទ​សួរ​ដោយ​ផ្ទាល់​មាត់​អំពី​ការ​ទាមទារ​ដែល​មាន​លក្ខណៈ​ប្រកួត​ប្រជែង​របស់​អ្នក​ផ្តល់​គំរូ​ធំ។ ក្រុមហ៊ុនទាំងនេះបោះផ្សាយលទ្ធផលគោលដោយប្រើប្រាស់ខ្សែ ដែលត្រូវបានធ្វើឱ្យប្រសើរសម្រាប់ម៉ូដែលផ្ទាល់ខ្លួនរបស់ពួកគេ។ ការស្រាវជ្រាវរបស់ AWS បង្ហាញថា ខ្សែសង្វាក់គំរូ – ផ្អែកលើគោលការណ៍នៃការរចនាដែលដំណើរការលើ Claude, GPT, Gemini និង Grok ដោយមិនមានការលៃតម្រូវគំរូជាក់លាក់ – អាចបំពេញបាន ឬលើសពីតម្លៃទាំងនេះ។

Deoras បាននិយាយថា “ការអនុវត្តភ្នាក់ងារគឺពិតជាមិនភ្ជាប់ទៅនឹងអ្នកផ្តល់គំរូតែមួយទេ” ។ “នេះបើកលទ្ធភាពនៃការបង្កើតកម្មវិធីផ្សេងៗដោយមិនកំណត់ចំពោះគំរូជាក់លាក់។”

ដើម្បីគាំទ្រការអះអាងនេះ AWS open source ក្របខ័ណ្ឌរបស់ខ្លួនដែលហៅថា Simple Strands Agent ដែលដំណើរការលើសពីជម្រើសប្រភពបើកចំហដ៏ពេញនិយមនៅក្នុងស្តង់ដារឧស្សាហកម្មសំខាន់ៗចំនួនបី នេះបើយោងតាមអ្នកស្រាវជ្រាវ។

ទឡ្ហីករណ៍កាន់តែស៊ីជម្រៅដែលជាមូលដ្ឋានទាំងអស់គឺជារឿងមួយដែលឧស្សាហកម្មនេះមានភាពយឺតយ៉ាវក្នុងការទទួលយក។ ការស្រាវជ្រាវបានអះអាងថា ការកែលម្អការអនុវត្ត AI ភាគច្រើនរហូតមកដល់បច្ចុប្បន្នគឺមានភាពផុយស្រួយ៖ ការបង្កើនប្រសិទ្ធភាពដែលសម្របខ្លួនខ្លាំងពេកទៅនឹងលក្ខណៈជាក់លាក់នៃកំណែគំរូជាក់លាក់មួយ ហើយបន្ទាប់មកបាត់ទៅវិញនៅពេលដែលម៉ូដែលមានភាពប្រសើរឡើង។

ការសិក្សាបាននិយាយថា “នៅពេលដែលគំរូមានភាពប្រសើរឡើង ឥរិយាបថទាំងនេះផ្លាស់ប្តូរ ធ្វើឱ្យការទទួលបានភាពផុយស្រួយ និងមិនបំពេញបន្ថែម” ។

អ្វី​ដែល​ត្រូវ​ការ​ជំនួស​វិញ​គឺ​គោលការណ៍​មិន​ប្រែប្រួល – ការ​សម្រេច​ចិត្ត​ក្នុង​ការ​រចនា​ដែល​នៅ​រស់រាន​មាន​ជីវិត​ពី​ការ​អាប់ដេត​ម៉ូដែល​ដោយ​សារ​តែ​វា​ត្រូវ​បាន​បង្កើត​ឡើង​ក្នុង​ខ្សែ​ជាជាង​ម៉ូដែល។ Deoras បាននិយាយថា ការរកឃើញនៃអវតារទាំងនេះគឺជាការរកឃើញដែលធ្វើឱ្យគាត់ភ្ញាក់ផ្អើលបំផុត។

លោកបានមានប្រសាសន៍ថា “ទោះបីជាមានភាពខុសប្លែកគ្នាទាំងអស់នៅក្នុងទស្សនវិជ្ជាគំរូក៏ដោយ វាមានទ្រព្យសម្បត្តិមិនផ្លាស់ប្តូរធម្មតាដែលភ្ជាប់គំរូទាំងអស់នេះជាមួយគ្នា។ “ខ្ញុំមិនបានរំពឹងទុករឿងនេះទេ ប៉ុន្តែទិន្នន័យនេះបានផុសឡើងដោយធម្មជាតិពីដាននៃការសង្កេតរបស់យើង”។

ផលប៉ះពាល់ជាក់ស្តែងគឺជាក់ស្តែងសម្រាប់ការកសាងស្ថាប័នណាមួយនៅលើ AI ។ ក្រុមការងារដែលទទួលខុសត្រូវក្នុងការស្ថាបត្យកម្មខ្សែភ្លើងឡើងវិញរាល់ពេលដែលម៉ូដែលថ្មីចេញមក – ដែលបច្ចុប្បន្នគ្រប់ស្ថាប័នដែលប្រើភ្នាក់ងារ – កំពុងចំណាយពេលវេលារបស់ពួកគេលើបញ្ហាខុស។

Deoras បាននិយាយថា “ក្រុមនេះមានការស្រើបស្រាលជាមួយនឹងការផ្លាស់ប្តូរគំរូ និងស្ថាបត្យកម្មឡើងវិញជាមួយនឹងរាល់ការអាប់ដេតម៉ូដែល”។

ចក្ខុវិស័យដែលគាត់ពណ៌នាអំពីកន្លែងដែលភ្នាក់ងារកំពុងទៅ មិនមែនជាស្វ័យភាពដែលមិនអាចគ្រប់គ្រងបាននោះទេ ប៉ុន្តែជាអ្វីដែលត្រូវគិតបន្ថែមទៀត៖ មនុស្សផ្តល់ការណែនាំ ភ្នាក់ងារប្រតិបត្តិ និងប្រអប់ខ្សាច់ចាប់កំហុសរវាងគ្នា។

លោក​បាន​ថ្លែង​ថា​៖ «​អ្នក​ចង់​ឲ្យ​មនុស្ស​កាន់​កង់ ដឹកនាំ​ការងារ ហើយ​បន្ទាប់​មក​ដក​ដៃ​ចេញ»។ “នេះគឺជាអនាគតដែលយើងកំពុងឆ្ពោះទៅរក” ។

ថាតើឧស្សាហកម្មនេះនឹងទៅដល់ទីនោះមុនពេលដែលវាត្រូវបានចាប់បានដោយងងឹតងងុល ឬយ៉ាងណាសម្រាប់ពេលនេះ គឺជាសំណួរបើកចំហ។



Source link