Home នយោបាយ / Politic Google DeepMind បង្ហាញផែនការការពារខ្លួនពីភ្នាក់ងារ AI បោកប្រាស់របស់ខ្លួន។

Google DeepMind បង្ហាញផែនការការពារខ្លួនពីភ្នាក់ងារ AI បោកប្រាស់របស់ខ្លួន។

14
0



Google បានបង្កើតផែនការថ្មីមួយដើម្បីត្រួតពិនិត្យភ្នាក់ងារ AI ដ៏មានឥទ្ធិពលដែលវាប្រើប្រាស់នៅក្នុងស្ថាប័នស្រាវជ្រាវ AI របស់ខ្លួន ហើយក្រុមហ៊ុនកំពុងបញ្ចេញនូវអ្វីដែលហៅថាផែនទីបង្ហាញផ្លូវដើម្បីជួយដល់មន្ទីរពិសោធន៍ AI ផ្សេងទៀតការពារការគំរាមកំហែងសក្តានុពលនៃភ្នាក់ងារ AI បញ្ឆោតទាំងឡាយ។

ផែនការសុវត្ថិភាព Google Deepmind ពាក់ព័ន្ធនឹងការចាកចេញពីសហគមន៍សុវត្ថិភាព AI ជាធម្មតាលើ “បញ្ហាតម្រឹម” – គំនិតនៃការស្វែងរកវិធីបណ្តុះបណ្តាលប្រព័ន្ធ AI ដើម្បីឱ្យសកម្មភាពរបស់វាសមស្របនឹងចេតនា គុណតម្លៃ និងសីលធម៌របស់មនុស្សដែលគ្រប់គ្រងវា។

ខណៈពេលដែលវាបន្តនិយាយថាការតម្រឹមគឺជាធាតុផ្សំសុវត្ថិភាពដ៏សំខាន់ Google ទទួលស្គាល់នៅក្នុងផែនទីបង្ហាញផ្លូវរបស់ខ្លួនថាបញ្ហាតម្រឹមប្រហែលជាមិនអាចដោះស្រាយបានពេញលេញទេ ហើយជំនួសឱ្យការបង្កើតប្រព័ន្ធសុវត្ថិភាពជាស្រទាប់ដែលចាត់ទុកភ្នាក់ងារ AI ថាជាអ្នកបញ្ឆោតទាំងឡាយដែលមានសក្តានុពលនៅក្នុងស្ថាប័នមួយ។ របាយការណ៍បច្ចេកទេស 35 ទំព័រពិពណ៌នាអំពីជំហាន និងនីតិវិធីជាច្រើនដែលបានរចនាឡើងដើម្បីស្វែងរកអាកប្បកិរិយាជាសត្រូវដែលមានសក្តានុពលដោយភ្នាក់ងារ AI ។

“ប្រសិនបើខ្សែការពារទីមួយ – ការតម្រឹម – បរាជ័យ តើយើងអាចកំណត់ការខូចខាតដោយរបៀបណា?” លោក Rohin Shah ដែលដឹកនាំក្រុម AGI Safey & Alignment នៅ Google DeepMind បាននិយាយ ទ្រព្យសកម្ម នៅក្នុងបទសម្ភាសន៍មួយ។

ក្របខ័ណ្ឌភ្នាក់ងារ AI ខ្ចីយ៉ាងច្រើនពីសន្តិសុខតាមអ៊ីនធឺណិតជាប្រពៃណី ជាពិសេសការការពារការគំរាមកំហែងខាងក្នុង។ Shah បាននិយាយថា “យើងកំពុងខ្ចីប្រាក់យ៉ាងច្រើនពីសន្តិសុខដែលដោះស្រាយរួចហើយជាមួយនឹងការគំរាមកំហែងរបស់បុគ្គលិកខាងក្នុងដែលអាចមានគំនិតអាក្រក់ ហើយយើងអាចអនុវត្តវាទៅបរិយាកាសថ្មីមួយ” Shah បាននិយាយថា។ ទោះយ៉ាងណាក៏ដោយគាត់បានកត់សម្គាល់ថា “AI មានលក្ខណៈជាប្រព័ន្ធខុសពីមនុស្ស” ។

ម៉្យាងវិញទៀត ភ្នាក់ងារ AI អាចធ្វើសកម្មភាពបានលឿន និងក្នុងទ្រង់ទ្រាយធំជាងបុគ្គលិកបោកប្រាស់ម្នាក់ដែលមិនធ្លាប់មាន។ ដូច្នេះហើយ ត្រូវតែមានប្រព័ន្ធដែលអាចគ្រប់គ្រងឧបករណ៍ និងទិន្នន័យណាដែលភ្នាក់ងារ AI មានសិទ្ធិចូលប្រើប្រាស់ ក៏ដូចជាប្រព័ន្ធដែលអាចតាមដានឥរិយាបថរបស់ភ្នាក់ងារ AI និងអាចរកឃើញលំនាំខុសឆ្គងក្នុងពេលវេលាជាក់ស្តែង។

ក៏មានភាពខុសគ្នាផ្សេងទៀតដែរ។ ឧទាហរណ៍ ប្រព័ន្ធគ្រប់គ្រងការចូលប្រើ និងការអនុញ្ញាតជាច្រើនសម្រាប់បុគ្គលិករបស់មនុស្សគឺផ្អែកលើតួនាទីរបស់បុគ្គលិកជាក់លាក់នៅក្នុងក្រុមហ៊ុន។ អ្នកគ្រប់គ្រងប្រព័ន្ធមានការអនុញ្ញាតជាក់លាក់ ដែលឧទាហរណ៍ អ្នកទទួលភ្ញៀវមិនមាន។ ក្រុមហ៊ុនមួយចំនួន និងសូម្បីតែអ្នកលក់កម្មវិធីមួយចំនួនដែលលក់កម្មវិធី AI “orchestration layer” ភ្នាក់ងារ AI ដែលជារឿយៗរួមបញ្ចូលការគ្រប់គ្រងការចូលប្រើសម្រាប់ភ្នាក់ងារ AI បច្ចុប្បន្នកំពុងព្យាយាមអនុវត្តគំនិតនេះទៅកាន់ពិភពនៃភ្នាក់ងារ AI ជាឧទាហរណ៍ ដោយបញ្ជាក់ថាភ្នាក់ងារ AI គួរតែមានសិទ្ធិចូលប្រើ និងការអនុញ្ញាតដូចគ្នាទៅនឹងបុគ្គលិករបស់មនុស្សដែលជំនួសឱ្យវាកំពុងធ្វើការ។

លោក John “Four” Flynn អនុប្រធានផ្នែកសន្តិសុខ និងឯកជននៅ Google DeepMind បាននិយាយថា ប៉ុន្តែគំនិតនោះអាចបរាជ័យយ៉ាងឆាប់រហ័ស។ ទ្រព្យសកម្ម. ម៉្យាងវិញទៀត ជាមួយនឹងការបង្កើនស្វ័យប្រវត្តិកម្មនៃលំហូរការងារ វាអាចមិនច្បាស់ថាអ្នកណានៅក្នុងអង្គការភ្នាក់ងារកំពុងធ្វើការឱ្យ។ ទីពីរ នៅក្នុងដំណើរការការងារដោយស្វ័យប្រវត្តិយ៉ាងពេញលេញ ភ្នាក់ងារ AI តែមួយអាចអនុវត្តភារកិច្ចដែលជាប់ទាក់ទងនឹងតួនាទីផ្សេងៗគ្នាជាច្រើន មិនមែនតែមួយទេ។ នៅពេលដែលប្រព័ន្ធ AI កាន់តែឆ្លាតវៃ ក្រុមហ៊ុននានាប្រហែលជាចង់ឱ្យភ្នាក់ងារ AI ដូចគ្នាអនុវត្តការងារលើលំហូរការងារ និងដំណើរការផ្សេងៗគ្នាជាច្រើន។ លោក Flynn បាននិយាយថា នៅក្នុងបរិយាកាសបែបនេះ តួនាទីឋិតិវន្ត និងសូម្បីតែការអនុញ្ញាតដែលផ្អែកលើដំណើរការឋិតិវន្ត និងប្រព័ន្ធគ្រប់គ្រងការចូលប្រើអាចនឹងមិនដំណើរការល្អនោះទេ។

ជំនួសមកវិញ ប្រព័ន្ធគ្រប់គ្រងការចូលប្រើថាមវន្តច្រើនគឺត្រូវបានទាមទារដែលអាចផ្លាស់ប្តូរក្នុងពេលវេលាជាក់ស្តែងអាស្រ័យលើភារកិច្ចដែលភ្នាក់ងារ AI កំពុងព្យាយាមអនុវត្ត និងរបៀបដែលកិច្ចការនោះសមនឹងដំណើរការការងារជាក់លាក់។ Flynn បាននិយាយថាគាត់អាចស្រមៃមើលសេណារីយ៉ូដែលភ្នាក់ងារ AI ដូចគ្នាអាចមានការអនុញ្ញាតឱ្យអនុវត្តសកម្មភាពជាក់លាក់មួយ ឬចូលប្រើមូលដ្ឋានទិន្នន័យជាក់លាក់សម្រាប់កិច្ចការនៅក្នុងលំហូរការងារជាក់លាក់មួយ ប៉ុន្តែប្រហែលជាមិនត្រូវបានអនុញ្ញាតឱ្យចូលប្រើដូចគ្នាប៉ុន្មាននាទីក្រោយមកក្នុងដំណើរការការងារផ្សេង។ លោក Flynn បាននិយាយថា អ្វីដែលត្រូវការគឺប្រព័ន្ធត្រួតពិនិត្យភ្នាក់ងារ AI ដ៏ទំនើបដែលដឹងពីអាកប្បកិរិយាធម្មតារបស់ភ្នាក់ងារគួរតែសម្រាប់កិច្ចការដែលបានផ្តល់ឱ្យនៅក្នុងដំណើរការការងារណាមួយ ហើយរកឃើញគម្លាតពីគំរូនោះក្នុងពេលជាក់ស្តែង ហើយឆ្លើយតបយ៉ាងរហ័សដើម្បីបិទការចូលប្រើប្រាស់ ប្រសិនបើប្រព័ន្ធត្រួតពិនិត្យសង្ស័យថាភ្នាក់ងារ AI កំពុងព្យាយាមធ្វើអ្វីមួយដែលមិនគួរ។

យោងតាមការបង្ហោះប្លុកនៅលើផែនទីបង្ហាញផ្លូវថ្មីរបស់ខ្លួនសម្រាប់សន្តិសុខភ្នាក់ងារ AI DeepMind បានបង្កើតគំរូខាងក្នុងរួចហើយ ដែលត្រួតពិនិត្យមើលគន្លងភ្នាក់ងារសរសេរកូដដោយអសមកាល និងបញ្ជូនលទ្ធផលគួរឱ្យសង្ស័យសម្រាប់ការពិនិត្យឡើងវិញរបស់មនុស្ស។ យោងតាម ​​DeepMind ប្រព័ន្ធនេះបានវិភាគប្រហែលមួយលានភារកិច្ចភ្នាក់ងារសរសេរកូដ។ ប្រៃសណីយ៍បាននិយាយថា ការងារនេះមានសារៈសំខាន់ក្នុងការបង្កើតម៉ូនីទ័រផ្ទាល់សម្រាប់ភ្នាក់ងារ Gemini Spark ដែលអនុញ្ញាតឱ្យក្រុមហ៊ុនឆ្លើយតបក្នុងពេលវេលាជាក់ស្តែងចំពោះបញ្ហាដូចជាការលុបទិន្នន័យដោយចៃដន្យ។

គួរកត់សម្គាល់ថា DeepMind និយាយថាភាគច្រើននៃអ្វីដែលរបាយការណ៍ត្រួតពិនិត្យរបស់ខ្លួនគឺមិនព្យាបាទទេ។ ការបង្ហោះប្លក់បាននិយាយថា “ភាគច្រើននៃព្រឹត្តិការណ៍ដែលបានរាយការណ៍មិនមែនដោយសារចេតនាអរិភាពទេ”។ ពួកវាច្រើនតែកើតចេញពី “ការបកស្រាយខុសរបស់ភ្នាក់ងារ ឬការខ្នះខ្នែងខ្លាំងពេកក្នុងការសម្រេចបាននូវគោលដៅរបស់អ្នកប្រើ”។

ប្រភេទនៃការត្រួតពិនិត្យអាកប្បកិរិយាក្នុងពេលជាក់ស្តែងនេះគឺគ្រាន់តែជាវិធីមួយក្នុងចំណោមវិធី 15 ផ្សេងគ្នាដើម្បីកាត់បន្ថយហានិភ័យនៃភ្នាក់ងារ AI ក្លែងបន្លំដែល Google DeepMind ណែនាំនៅក្នុងផែនទីបង្ហាញផ្លូវរបស់វា។ ខ្លះទៀតរួមបញ្ចូលអ្វីៗគ្រប់យ៉ាងពីកំណត់ហេតុសកម្មភាពបណ្តាញសាមញ្ញ ដែលអាចត្រូវបានពិនិត្យក្នុងពេលវេលាជាក់ស្តែង ឬធ្វើសវនកម្មនៅពេលក្រោយ រហូតដល់ការប្រើប្រាស់គំរូ AI ដែលមិនសូវស្មុគ្រស្មាញ ប៉ុន្តែគួរឱ្យទុកចិត្ត ដើម្បីតាមដាន “ដំណើរស្វែងរកហេតុផល” របស់ភ្នាក់ងារ AI ។ ដាននៃការវែកញែកគឺជាប្រភេទនៃ “ខ្សែសង្វាក់នៃការគិត” អត្ថបទច្បាស់លាស់ ដែលគំរូ AI បង្ហាញនៅពេលវាគិតអំពីសកម្មភាពដែលត្រូវអនុវត្ត។ ទោះជាយ៉ាងណាក៏ដោយ អ្នកស្រាវជ្រាវបានរកឃើញថាដានហេតុផលទាំងនេះមិនតែងតែឆ្លុះបញ្ចាំងយ៉ាងត្រឹមត្រូវនូវអ្វីដែលគំរូគឺ “ការគិត” នោះទេ។ ដូច្នេះហើយ ពួកគេក៏ស្នើឱ្យត្រួតពិនិត្យលំនាំធ្វើឱ្យសកម្មនៃណឺរ៉ូនឌីជីថលនៅក្នុងបណ្តាញសរសៃប្រសាទធំៗ ដែលផ្តល់ថាមពលដល់ម៉ូដែល AI នាពេលបច្ចុប្បន្ននេះ ដើម្បីរកឱ្យឃើញសញ្ញាថាគំរូនេះបោកបញ្ឆោត។ Google DeepMind ប្រដូចវាទៅនឹងការប្រើប្រាស់ “fMRI” ស្កេនខួរក្បាលរបស់មនុស្សដើម្បីព្យាយាមអានស្ថានភាពអារម្មណ៍ ឬគំនិតរបស់ពួកគេក្នុងពេលវេលាជាក់ស្តែង។

នៅក្នុងឯកសារបច្ចេកទេស AI Agent Security Roadmap, Google DeepMind បង្កើតក្របខ័ណ្ឌមួយហៅថា TRAIT&R – ការកំណត់រចនាសម្ព័ន្ធនៃយុទ្ធសាស្ត្រ និងទម្លាប់ AI បោកបញ្ឆោត – ដែលត្រូវបានយកគំរូតាមយ៉ាងជិតស្និទ្ធលើ ATT&CK ដែលជាមូលដ្ឋានចំណេះដឹងស្តីពីអាកប្បកិរិយាសុវត្ថិភាពតាមអ៊ីនធឺណិតដែលជាសត្រូវដែលរក្សាដោយ MITER ទីភ្នាក់ងារប្រឹក្សាផ្នែកវិស្វកម្ម និងក្រុមហ៊ុនមិនរកប្រាក់ចំណេញរបស់សហរដ្ឋអាមេរិក។ និក្ខេបបទបង្ហាញការគំរាមកំហែងបីប្រភេទដែល Google DeepMind និយាយថាខ្លួនចង់ការពារប្រឆាំងនឹង៖ “ការបាត់បង់ការគ្រប់គ្រង” (ឧ. នៅពេលដែលគំរូបង្កើតការដាក់ពង្រាយខាងក្នុងដែលលាក់បាំងដោយមិនបានត្រួតពិនិត្យ) “ការបំផ្លិចបំផ្លាញការងារ” (ឧ. ភ្នាក់ងារសម្របសម្រួលដោយស្ងៀមស្ងាត់ការតម្រឹម ឬការស្រាវជ្រាវសុវត្ថិភាព) និង “ការបំផ្លាញដោយផ្ទាល់” (ឧទាហរណ៍) ការបំផ្លិចបំផ្លាញទ្រព្យសម្បត្តិ។

លោក Flynn អនុប្រធានផ្នែកសន្តិសុខបាននិយាយនៅក្នុងបទសម្ភាសន៍ថាក្រុមហ៊ុនបាន “ឆ្ងាយណាស់” នៅក្នុងការអនុវត្តផែនទីបង្ហាញផ្លូវរបស់ខ្លួន។ លោកបានមានប្រសាសន៍ថា “វាជាច្រើនកំពុងដំណើរការ ហើយមួយចំនួនទៀតកំពុងស្ថិតក្នុងការផលិត វាជាច្រើនជុំវិញការគ្រប់គ្រងការចូលប្រើ ការរកឃើញ ការត្រួតពិនិត្យខ្សែសង្វាក់គំនិត។ ចំនួនដ៏ច្រើនរបស់វានៅទីនោះ និងកំពុងដំណើរការ”។

Shah បាននិយាយថា ក្របខណ្ឌនេះក៏ត្រូវបានបង្កើតឡើងផងដែរ ដើម្បីដោះស្រាយទម្រង់នៃគ្រោះថ្នាក់បន្ថែមទៀត។ លោកបានកត់សម្គាល់ថាការបំផ្លិចបំផ្លាញការងារអាចត្រូវបានសម្រេច “តាមរយៈការបញ្ចុះបញ្ចូល – ដោយការបង្ហាញពីលទ្ធផលខុសឆ្គងនិងលាក់កំហុស” ដូច្នេះអ្នកប្រើប្រាស់ “ឈានដល់ការសន្និដ្ឋានមិនពិត” ដែលជាប្រភេទដែលកាសែតទទួលស្គាល់ថាជាការលំបាកបំផុតក្នុងការរកឃើញ។

ផែនទីបង្ហាញផ្លូវដែល DeepMind បានដាក់ឈ្មោះថា “v0.1” ត្រូវបានពិពណ៌នាថាជាការងារដែលកំពុងដំណើរការដែលក្រុមហ៊ុនគ្រោងនឹងបញ្ចូលទៅក្នុងក្របខ័ណ្ឌសុវត្ថិភាពព្រំដែនដ៏ធំទូលាយរបស់ខ្លួននៅពេលដែលវាចាស់ទុំ។



Source link