Tech

คอมพิวเตอร์วิทัศน์และการเรียนรู้เชิงลึกเป็นวิธีใหม่ในการตรวจจับภัยคุกคามทางไซเบอร์

Transform Technology Summits เริ่มต้นวันที่ 13 ตุลาคมด้วย Low-Code/No Code: เปิดใช้งาน Enterprise Agility สมัครตอนนี้!


ทศวรรษที่ผ่านมามีความสนใจในการเรียนรู้เชิงลึก เพิ่มมากขึ้น ถูกกระตุ้นโดยความสามารถที่พิสูจน์แล้วของโครงข่ายประสาทเทียมในงานคอมพิวเตอร์วิทัศน์ หากคุณฝึกโครงข่ายประสาทเทียมด้วยภาพถ่ายแมวและสุนัขที่มีป้ายกำกับเพียงพอ จะสามารถค้นหารูปแบบที่เกิดซ้ำในแต่ละหมวดหมู่และจำแนกภาพที่มองไม่เห็นได้อย่างแม่นยำ

อะไร คุณสามารถใช้ตัวแยกประเภทรูปภาพทำอย่างอื่นได้ไหม

ในปี 2019 กลุ่มนักวิจัยด้านความปลอดภัยทางไซเบอร์สงสัยว่าพวกเขาสามารถจัดการการตรวจจับภัยคุกคามความปลอดภัยเป็นปัญหาการจำแนกรูปภาพได้หรือไม่ สัญชาตญาณของพวกเขาได้รับการพิสูจน์แล้วว่าอยู่ในตำแหน่งที่ดี และพวกเขาสามารถสร้างโมเดลการเรียนรู้ของเครื่องที่สามารถตรวจจับมัลแวร์ตามรูปภาพที่สร้างจากเนื้อหาของไฟล์แอปพลิเคชันได้ อีกหนึ่งปีต่อมา เทคนิคเดียวกันนี้ถูกใช้ในการพัฒนาระบบการเรียนรู้ของเครื่องที่ ตรวจพบเว็บไซต์ฟิชชิ่ง

การผสมผสานระหว่างการสร้างภาพข้อมูลไบนารีและการเรียนรู้ของเครื่องเป็นเทคนิคอันทรงพลังที่สามารถให้แนวทางแก้ไขปัญหาแบบเก่าได้ มันกำลังแสดงสัญญาในการรักษาความปลอดภัยทางไซเบอร์ แต่ก็สามารถนำไปใช้กับโดเมนอื่น ๆ ได้ การตรวจจับมัลแวร์ด้วยการเรียนรู้เชิงลึก

วิธีดั้งเดิมในการตรวจหามัลแวร์คือการค้นหาไฟล์สำหรับลายเซ็นที่ทราบของเพย์โหลดที่เป็นอันตราย ตัวตรวจจับมัลแวร์จะรักษาฐานข้อมูลของคำจำกัดความของไวรัสซึ่งรวมถึงลำดับ opcode หรือข้อมูลโค้ด และค้นหาไฟล์ใหม่เพื่อดูว่ามีลายเซ็นเหล่านี้อยู่หรือไม่ น่าเสียดายที่นักพัฒนามัลแวร์สามารถหลีกเลี่ยงวิธีการตรวจจับดังกล่าวได้อย่างง่ายดายโดยใช้เทคนิคต่างๆ เช่น การทำให้โค้ดสับสนหรือใช้เทคนิคความหลากหลายในการกลายพันธุ์ของโค้ดในขณะใช้งานจริง

เครื่องมือวิเคราะห์แบบไดนามิกพยายามตรวจจับ พฤติกรรมที่เป็นอันตรายระหว่างรันไทม์ แต่จะช้าและต้องมีการตั้งค่าสภาพแวดล้อมแบบแซนด์บ็อกซ์เพื่อทดสอบโปรแกรมที่น่าสงสัย

ในช่วงไม่กี่ปีที่ผ่านมานักวิจัยได้ลองใช้ เทคนิคการเรียนรู้ของเครื่อง เพื่อตรวจจับมัลแวร์ โมเดล ML เหล่านี้สามารถจัดการกับความท้าทายบางอย่างในการตรวจจับมัลแวร์ได้ รวมถึงการสับสนของโค้ด แต่พวกเขานำเสนอความท้าทายใหม่ ๆ รวมถึงความจำเป็นในการเรียนรู้คุณสมบัติมากเกินไปและสภาพแวดล้อมเสมือนจริงในการวิเคราะห์ตัวอย่างเป้าหมาย

การสร้างภาพไบนารีสามารถกำหนดการตรวจจับมัลแวร์ใหม่โดยเปลี่ยนเป็น ปัญหาการมองเห็นคอมพิวเตอร์ ในวิธีการนี้ ไฟล์จะถูกเรียกใช้ผ่านอัลกอริธึมที่แปลงค่าไบนารีและ ASCII เป็นรหัสสี

ใน กระดาษที่ตีพิมพ์ในปี 2019 นักวิจัยจาก University of Plymouth และ University of Peloponnese แสดงให้เห็นว่าเมื่อเห็นภาพไฟล์ที่ไม่เป็นอันตรายและเป็นอันตรายโดยใช้วิธีนี้ รูปแบบใหม่ๆ ก็ปรากฏขึ้นที่แยกอันตรายและปลอดภัย ไฟล์. ความแตกต่างเหล่านี้จะไม่มีใครสังเกตเห็นโดยใช้วิธีการตรวจหามัลแวร์แบบคลาสสิก

จากรายงานระบุว่า “ไฟล์ที่เป็นอันตรายมักจะรวมถึงอักขระ ASCII ประเภทต่างๆ นำเสนอภาพที่มีสีสัน ในขณะที่ไฟล์ที่ไม่เป็นอันตรายจะมี ภาพที่สะอาดขึ้นและการกระจายของค่า”

เมื่อคุณมีรูปแบบที่ตรวจจับได้ดังกล่าว คุณสามารถฝึก html-to-color โครงข่ายประสาทเทียม

เพื่อบอกความแตกต่างระหว่างไฟล์ที่เป็นอันตรายและไฟล์ที่ปลอดภัย นักวิจัยได้สร้างชุดข้อมูลของไฟล์ไบนารีที่มองเห็นได้ซึ่งรวมถึงไฟล์ที่ไม่เป็นพิษเป็นภัยและไฟล์ที่เป็นอันตราย ชุดข้อมูลประกอบด้วยเพย์โหลดที่เป็นอันตรายมากมาย (ไวรัส เวิร์ม โทรจัน รูทคิต ฯลฯ) และประเภทไฟล์ (.exe, .doc, .pdf, .txt เป็นต้น)

นักวิจัยจึงใช้ภาพเหล่านี้ในการฝึกโครงข่ายประสาทลักษณนาม สถาปัตยกรรมที่พวกเขาใช้คือโครงข่ายประสาทเทียมแบบเพิ่มหน่วย (SOINN) ที่จัดตัวเองได้ ซึ่งรวดเร็วและดีเป็นพิเศษในการจัดการกับข้อมูลที่มีเสียงดัง พวกเขายังใช้เทคนิคการประมวลผลภาพล่วงหน้าเพื่อลดขนาดภาพไบนารีเป็นเวกเตอร์คุณสมบัติขนาด 1,024 ซึ่งทำให้การเรียนรู้รูปแบบในข้อมูลอินพุตง่ายขึ้นและมีประสิทธิภาพในการคำนวณ

การตรวจจับมัลแวร์ด้วยสถาปัตยกรรมการเรียนรู้เชิงลึก

ด้านบน: สถาปัตยกรรมของระบบการเรียนรู้เชิงลึกที่ตรวจจับมัลแวร์จากการสร้างภาพไบนารี .

โครงข่ายประสาทที่เกิดขึ้นนั้นมีประสิทธิภาพเพียงพอที่จะคำนวณชุดข้อมูลการฝึกอบรมด้วยตัวอย่าง 4,000 ตัวอย่างใน 15 วินาทีบนเวิร์กสเตชันส่วนบุคคลที่มีโปรเซสเซอร์ Intel Core i5

การทดลองโดยนักวิจัยพบว่ารูปแบบการเรียนรู้เชิงลึกนั้นดีเป็นพิเศษในการตรวจจับมัลแวร์ในไฟล์ .doc และ .pdf ซึ่งเป็นสื่อที่ต้องการสำหรับ แรนซัมแวร์โจมตี นักวิจัยแนะนำว่าประสิทธิภาพของโมเดลสามารถปรับปรุงได้หากมีการปรับให้ใช้ประเภทไฟล์เป็นมิติการเรียนรู้อย่างหนึ่ง โดยรวมแล้ว อัลกอริธึมมีอัตราการตรวจจับเฉลี่ยประมาณ 74 เปอร์เซ็นต์ การตรวจจับเว็บไซต์ฟิชชิ่งด้วยการเรียนรู้เชิงลึก

การโจมตีแบบฟิชชิ่งกำลังกลายเป็นปัญหาที่เพิ่มขึ้นสำหรับองค์กรและบุคคล การโจมตีแบบฟิชชิ่งจำนวนมากหลอกลวงให้เหยื่อคลิกลิงก์ไปยังเว็บไซต์ที่เป็นอันตรายซึ่งอ้างว่าเป็นบริการที่ถูกต้อง โดยที่พวกเขาลงเอยด้วยการป้อนข้อมูลที่ละเอียดอ่อน เช่น ข้อมูลประจำตัวหรือข้อมูลทางการเงิน

วิธีการดั้งเดิมในการตรวจหาเว็บไซต์ฟิชชิ่งนั้นเกี่ยวข้องกับการขึ้นบัญชีดำโดเมนที่เป็นอันตรายหรืออนุญาตโดเมนที่ปลอดภัย วิธีเดิมพลาดเว็บไซต์ฟิชชิ่งใหม่จนกว่าจะมีผู้ตกเป็นเหยื่อ และวิธีหลังมีข้อจำกัดมากเกินไป และต้องใช้ความพยายามอย่างมากในการเข้าถึงโดเมนที่ปลอดภัยทั้งหมด

วิธีการตรวจจับอื่นๆ อาศัย ฮิวริสติก วิธีการเหล่านี้แม่นยำกว่าบัญชีดำ แต่ก็ยังไม่สามารถให้การตรวจจับที่เหมาะสมได้

ในปี 2020 กลุ่มนักวิจัยจาก University of Plymouth และ University of Portsmouth ใช้การสร้างภาพข้อมูลแบบไบนารีและการเรียนรู้เชิงลึกเพื่อพัฒนาวิธีการใหม่ในการตรวจจับเว็บไซต์ฟิชชิ่ง

เทคนิคนี้ใช้ไลบรารีการสร้างภาพข้อมูลไบนารีเพื่อแปลงมาร์กอัปเว็บไซต์และซอร์สโค้ดเป็นค่าสี

เช่นเดียวกับไฟล์แอปพลิเคชันที่ไม่เป็นพิษเป็นภัยและเป็นอันตราย เมื่อแสดงภาพเว็บไซต์ รูปแบบที่ไม่ซ้ำกันจะปรากฏขึ้นที่แยกเว็บไซต์ที่ปลอดภัยและเป็นอันตราย นักวิจัยเขียนว่า “ไซต์ที่ถูกต้องตามกฎหมายมีค่า RGB ที่มีรายละเอียดมากกว่า เพราะจะสร้างจากอักขระเพิ่มเติมที่มาจากใบอนุญาต ไฮเปอร์ลิงก์ และแบบฟอร์มการป้อนข้อมูลโดยละเอียด ในขณะที่คู่ฟิชชิ่งโดยทั่วไปจะมีการอ้างอิง CSS เดียวหรือไม่มีเลย ภาพหลายภาพแทนที่จะเป็นแบบฟอร์ม และแบบฟอร์มการเข้าสู่ระบบเดียวที่ไม่มีสคริปต์ความปลอดภัย สิ่งนี้จะสร้างสตริงการป้อนข้อมูลที่มีขนาดเล็กลงเมื่อคัดลอกมา”

ตัวอย่างด้านล่างแสดงภาพแทนรหัสของการเข้าสู่ระบบ PayPal ที่ถูกต้องเมื่อเทียบกับเว็บไซต์ฟิชชิ่ง PayPal ปลอม

fake vs legitimate paypal login page

นักวิจัยได้สร้างชุดข้อมูลของภาพที่แสดงถึงรหัสของเว็บไซต์ที่ถูกกฎหมายและเป็นอันตราย และใช้เพื่อฝึกโมเดลการเรียนรู้ของเครื่องจำแนกประเภท

สถาปัตยกรรมที่พวกเขาใช้คือ MobileNet ซึ่งเป็นโครงข่ายประสาทเทียมที่มีน้ำหนักเบา

(CNN) ที่ได้รับการปรับให้ทำงานบนอุปกรณ์ของผู้ใช้แทนเซิร์ฟเวอร์คลาวด์ความจุสูง ซีเอ็นเอ็นเหมาะอย่างยิ่งสำหรับงาน คอมพิวเตอร์วิทัศน์ รวมถึงภาพ การจำแนกประเภทและการตรวจจับวัตถุ

เมื่อโมเดลได้รับการฝึกอบรมแล้ว โมเดลจะถูกเสียบเข้ากับเครื่องมือตรวจจับฟิชชิ่ง เมื่อผู้ใช้สะดุดกับเว็บไซต์ใหม่ อันดับแรกจะตรวจสอบว่า URL นั้นรวมอยู่ในฐานข้อมูลของโดเมนที่เป็นอันตรายหรือไม่ หากเป็นโดเมนใหม่ โดเมนนั้นจะถูกแปลงผ่านอัลกอริธึมการแสดงภาพและเรียกใช้ผ่านโครงข่ายประสาทเทียมเพื่อตรวจสอบว่าโดเมนนั้นมีรูปแบบของเว็บไซต์ที่เป็นอันตรายหรือไม่ สถาปัตยกรรมสองขั้นตอนนี้ทำให้แน่ใจว่าระบบใช้ความเร็วของฐานข้อมูลบัญชีดำและการตรวจจับอัจฉริยะของเทคนิคการตรวจจับฟิชชิ่งบนเครือข่ายประสาท

การทดลองของนักวิจัยพบว่า เทคนิคนี้สามารถตรวจจับเว็บไซต์ฟิชชิ่งได้อย่างแม่นยำถึง 94 เปอร์เซ็นต์ “การใช้เทคนิคการแสดงภาพช่วยให้เข้าใจถึงความแตกต่างเชิงโครงสร้างระหว่างหน้าเว็บที่ถูกกฎหมายและฟิชชิ่ง จากผลการทดลองเบื้องต้นของเรา วิธีการนี้ดูเหมือนจะเป็นไปได้และสามารถตรวจจับผู้โจมตีฟิชชิ่งได้อย่างรวดเร็วด้วยความแม่นยำสูง นอกจากนี้ วิธีการเรียนรู้จากการจัดประเภทที่ไม่ถูกต้องและปรับปรุงประสิทธิภาพ” นักวิจัยเขียน

/wp-content/uploads/2021/09/website-phishing-detection-machine-learning-architecture.jpg?resize=696%2C296&ssl=1&is-pending-load=1″ data-medium-file=”https://” i1.wp.com/bdtechtalks.com/wp-content/uploads/2021/09/website-phishing-detection-machine-learning-architecture.jpg?fit=300%2C128&ssl=1″ data-orig-file=”https ://i1.wp.com/bdtechtalks.com/wp-content/uploads/2021/09/website-phishing-detection-machine-learning-architecture.jpg?fit=936%2C398&ssl=1″ data-orig-size=”936,398″ data-permalink=”https://bdtechtalks.com/2021/09/10/computer-vision-deep-learning-threat-detection/website-phishing-detection-machine-learning-architecture/” data- recalc-dims=”1″ height=”296″ กำลังโหลด=”ขี้เกียจ” src=”https://i1.wp.com/bdtechtalks.com/wp-content/uploads/2021/09/website-phishing-detection- machine-learning-architecture.jpg?resize=696%2C296&ssl=1″ width=”696″>

ด้านบน: สถาปัตยกรรมของระบบการเรียนรู้เชิงลึกที่ตรวจจับเว็บไซต์ฟิชชิ่งผ่านการสร้างภาพข้อมูลแบบไบนารี

เมื่อเร็ว ๆ นี้ฉันได้พูดคุยกับ Stavros Shiaeles อาจารย์ด้านความปลอดภัยทางไซเบอร์ที่มหาวิทยาลัย Portsmouth และผู้เขียนร่วมของเอกสารทั้งสองฉบับ จากข้อมูลของ Shiaeles นักวิจัยกำลังอยู่ในขั้นตอนการเตรียมเทคนิคสำหรับการนำไปใช้ในแอปพลิเคชันในโลกแห่งความเป็นจริง

Shiaeles ยังสำรวจการใช้การสร้างภาพข้อมูลแบบไบนารีและการเรียนรู้ด้วยเครื่อง เพื่อตรวจจับทราฟฟิกของมัลแวร์ใน เครือข่าย IoT

เนื่องจาก แมชชีนเลิร์นนิงยังคงก้าวหน้า จะช่วยให้นักวิทยาศาสตร์มีเครื่องมือใหม่ๆ ในการจัดการกับความท้าทายด้านความปลอดภัยในโลกไซเบอร์ การสร้างภาพข้อมูลแบบไบนารีแสดงให้เห็นว่าด้วยความคิดสร้างสรรค์และความเข้มงวดเพียงพอ เราสามารถค้นหาวิธีแก้ไขปัญหาแบบเก่าได้

เรื่องนี้เดิมปรากฏบน Bdtechtalks.com. ลิขสิทธิ์ 2021 VentureBeat

ภารกิจของ VentureBeat คือการเป็นจัตุรัสกลางเมืองดิจิทัลสำหรับผู้มีอำนาจตัดสินใจด้านเทคนิคเพื่อรับความรู้เกี่ยวกับเทคโนโลยีที่เปลี่ยนแปลงและการทำธุรกรรม ไซต์ของเราให้ข้อมูลที่จำเป็นเกี่ยวกับเทคโนโลยีข้อมูลและกลยุทธ์เพื่อเป็นแนวทางในการเป็นผู้นำองค์กรของคุณ เราขอเชิญคุณเข้าร่วมเป็นสมาชิกชุมชนของเราเพื่อเข้าถึง:

    ข้อมูลล่าสุดในเรื่องที่คุณสนใจ
  • จดหมายข่าวของเรา
  • ปิดกั้นเนื้อหาผู้นำทางความคิดและส่วนลดในการเข้าถึงกิจกรรมล้ำค่าของเรา เช่น แปลง 2021: เรียนรู้เพิ่มเติม

  • คุณสมบัติเครือข่ายและอื่น ๆ
  • กลายเป็นสมาชิก

      ตรังủ ธุรกิจ อาหาร

    • ไลฟ์สไตล์

    เทค

  • ยุทธศาสตร์การตลาดดิจิทัล (Digital Marketing)

  • Back to top button