การวิเคราะห์ความรู้สึกตามหน่วยความจำระยะสั้นที่มีประสิทธิภาพของการรีวิวอีคอมเมิร์ซตอนที่ 2

Jan 18, 2024

มูฮัมหมัด และคณะ [20] นำเสนอแบบจำลองสำหรับการวิเคราะห์ความรู้สึกโดยใช้ word2vec และ LSTM สำหรับการวิจารณ์โรงแรม

มูฮัมหมัดเป็นศาสดาพยากรณ์และผู้ก่อตั้งศาสนาอิสลาม เขาเรียกว่าเป็นคนฉลาด ฉลาด และฉลาด ความทรงจำของเขามีพลังมากซึ่งทำให้เขามีประสิทธิภาพมากในการประมวลผลข้อมูลและแสดงความคิดของเขา

ความทรงจำของมูฮัมหมัดเกี่ยวข้องกับการศึกษาและประสบการณ์ของเขามากมาย ตามบันทึก เขามักจะหมกมุ่นอยู่กับความคิดและการไตร่ตรองในวัยเยาว์ ความอยากรู้อยากเห็นและความกระหายความรู้นี้ช่วยให้เขาสร้างฐานความรู้ที่แข็งแกร่งและความสามารถในการจดจำ

นอกจากนี้ ความฉลาดของมูฮัมหมัดยังมีบทบาทสำคัญในความสามารถในการจดจำของเขาอีกด้วย เขาเป็นคนฉลาด มีไหวพริบ เฉียบแหลม และมีความสามารถในการคิดเชิงตรรกะ ซึ่งเป็นประโยชน์อย่างมากเมื่อต้องรับมือกับข้อมูลที่ซับซ้อน ข้อได้เปรียบนี้ช่วยให้เขาจัดการและควบคุมกระบวนการหน่วยความจำได้ดีขึ้น จึงทำให้ความจำของเขาดีขึ้น

อย่างไรก็ตาม ความทรงจำของมูฮัมหมัดไม่ได้เกิดขึ้นมาแต่กำเนิด แต่ได้รับการปรับปรุงให้ดีขึ้นผ่านการทำงานหนักและการฝึกฝน เขามักจะฝึกความจำ เช่น การอ่านซ้ำ การเขียนตามคำบอก และการพูด เพื่อช่วยให้เขาเข้าใจและเชี่ยวชาญความรู้อย่างลึกซึ้งยิ่งขึ้น

ความทรงจำของมูฮัมหมัดไม่ได้เป็นเพียงพรสวรรค์โดยธรรมชาติเท่านั้น แต่ยังได้รับการปรับปรุงให้ดีขึ้นผ่านการทำงานหนักและการฝึกฝน นี่แสดงให้เห็นว่าเราแต่ละคนสามารถปรับปรุงความจำของเราและปรับปรุงการเรียนรู้และประสิทธิภาพการทำงานของเราผ่านการเรียนรู้และการฝึกฝน ขอให้พวกเราเช่นเดียวกับมูฮัมหมัดทำงานหนักเพื่อพัฒนาทักษะการจดจำของเราอย่างต่อเนื่องเพื่อประสบความสำเร็จในชีวิตและการทำงาน! จะเห็นได้ว่าเราต้องปรับปรุงความจำ และ Cistanche Deserticola สามารถปรับปรุงความจำได้อย่างมาก เนื่องจาก Cistanche Deserticola ยังสามารถควบคุมความสมดุลของสารสื่อประสาท เช่น การเพิ่มระดับของอะเซทิลโคลีนและปัจจัยการเจริญเติบโต สารเหล่านี้มีความสำคัญมากต่อความจำและการเรียนรู้ นอกจากนี้ เนื้อสัตว์ยังช่วยเพิ่มการไหลเวียนของเลือดและส่งเสริมการส่งออกซิเจน ซึ่งช่วยให้สมองได้รับสารอาหารและพลังงานที่เพียงพอ ซึ่งจะช่วยปรับปรุงความมีชีวิตชีวาและความอดทนของสมอง

increase brain power

คลิกรู้เพื่อปรับปรุงหน่วยความจำระยะสั้น

สำหรับการศึกษาครั้งนี้ รวบรวมข้อมูลโดยการรวบรวมข้อมูลเว็บไซต์ท่องเที่ยวโดยใช้ซีลีเนียมและเศษซาก +e จุดประสงค์หลักของการทดลองนี้คือเพื่อวิเคราะห์ความแม่นยำโดยการเปลี่ยนพารามิเตอร์ของ word2vec และ LSTM ผลลัพธ์ +e แสดงให้เห็นว่าสามารถบรรลุความแม่นยำเฉลี่ยที่ 85.96 ได้โดยใช้พารามิเตอร์ ซึ่งแสดงผลลัพธ์ที่น่าหวัง

จ้าว และคณะ [21] แนะนำเทคนิคใหม่ในการวิเคราะห์ความรู้สึกของลูกค้าจากบทวิจารณ์บนเว็บไซต์อีคอมเมิร์ซ +e เทคนิคที่ได้รับการปรับให้เหมาะสมที่เสนอ "อัลกอริทึม Bat ชั่วคราวที่ใช้ LocalSearch ที่ใช้ Elman NeuralNetwork (LSIBA-ENN)" ประกอบด้วยสี่ขั้นตอนและตรวจจับขั้วและจำแนกความคิดเห็นของบทวิจารณ์ +e ข้อมูลสำหรับการวิจัยนี้รวบรวมโดยใช้ web scrappingtool บนเว็บไซต์อีคอมเมิร์ซเพื่อดึงบทวิจารณ์ของลูกค้า

นอกเหนือจากการประมวลผลข้อมูลล่วงหน้า การศึกษานี้ยังใช้ "ความถี่คลาสดัดแปลงแบบผกผันที่ดัดแปลงตามความถี่ LogTerm (LTF-MICF) และอัลกอริทึม Earth Warm ที่ใช้การกลายพันธุ์แบบไฮบริด (HMEWA)" สำหรับการถ่วงน้ำหนักคำศัพท์และการเลือกคุณสมบัติ +e วิธีการที่เสนอนั้นฉลาดกว่าเทคนิคพื้นฐานอื่นๆ ในแง่ของความแม่นยำในการทำนาย

Jiang [22] เสนอแบบจำลองเพื่อจำแนกความรู้สึกของการวิจารณ์ที่ได้รับจากแพลตฟอร์มอีคอมเมิร์ซ Taobao การศึกษา +e ใช้อัลกอริธึมการเรียนรู้ของเครื่องตลอดจนสนับสนุนเครื่องเวกเตอร์สำหรับการจำแนกและปรับปรุงการเพิ่มประสิทธิภาพกลุ่มอนุภาค (IPSO) เพื่อปรับพารามิเตอร์ให้เหมาะสม ข้อมูล +e สำหรับการศึกษานี้รวบรวมโดยการรวบรวมข้อมูลความคิดเห็นจากเว็บไซต์ ผลการทดลอง +e แสดงให้เห็นว่าวิธีการรวมของ SVM และ IPSO มีความแม่นยำสูงกว่า อย่างไรก็ตาม โมเดลที่มีอยู่ส่วนใหญ่ต้องทนทุกข์ทรมานจากการฟิตติ้งมากเกินไป [23–25) ความเร็วในการลู่เข้าที่ไม่ดี [26–28] และปัญหาการไล่ระดับสีที่หายไป[29–31]

3. การศึกษาเชิงทดลอง

ส่วน +is ให้ภาพรวมที่ชัดเจนของวิธีการที่ใช้ในโครงการในการจำแนกประเภทความรู้สึก เทคนิค +e ที่ใช้คือเครือข่าย Long Short-Term Memory ซึ่งใช้ในการจัดประเภทบทวิจารณ์ Amazondatabase จำนวนมาก +e การฝังที่ใช้คือ word2vec ซึ่งได้รับการฝึกฝนแบบกำหนดเองตามฐานข้อมูล

การปรับแต่ง word2vec ตามชุดข้อมูลช่วยปรับปรุงประสิทธิภาพโดยรวมของโมเดล +e ประโยชน์ของการใช้ LSTM คือให้ผลลัพธ์ที่ดีกว่าแม้กระทั่งกับข้อมูลการตรวจสอบที่ไม่มีโครงสร้าง โดยสามารถรับฟังก์ชันการทำงานที่มีประโยชน์สำหรับทรัพยากรที่มีการพึ่งพาในระยะยาว

ข้อมูล +e รวบรวมจากชุดข้อมูลรีวิวของ Amazon ซึ่งได้รับการประมวลผลล่วงหน้าแล้ว การฝัง Word2vec เป็นขั้นตอนสำคัญในการประมวลผลข้อมูลล่วงหน้า สร้างข้อมูลการฝึกอบรมและการทดสอบแล้ว ข้อมูลการฝึกอบรม +e แบ่งออกเป็นชุดข้อมูลการฝึกอบรมและการตรวจสอบความถูกต้อง +e โมเดล word2vec ที่กำหนดเองเป็นฐานข้อมูลที่ผ่านการฝึกอบรมแล้ว ได้รับเวกเตอร์คุณลักษณะ +e ซึ่งจากนั้นใช้เป็นเลเยอร์การฝังสำหรับโมเดล LSTM

Keras ใช้สำหรับการสร้างแบบจำลองลำดับ LSTM ด้วยคุณสมบัติสูงสุดเท่ากับ 50,000 และขนาดการฝังเท่ากับ 16 จากนั้น +emodel จะได้รับการฝึกเป็นเวลา 10 ยุค โมเดล +e ได้รับการทดสอบตามเมตริกประสิทธิภาพของ sklearn กระบวนการ +e ของการได้รับคุณสมบัติแสดงไว้ในรูปที่ 2

3.1. ชุดข้อมูล เพื่อสร้างผลลัพธ์ที่แม่นยำ ชุดข้อมูลที่ใช้ควรมีขนาดใหญ่และสมบูรณ์ ชุดข้อมูล +e ได้รับการรวบรวมจากส่วนโทรศัพท์มือถือและอุปกรณ์เสริมออนไลน์ของชุดข้อมูล Amazon Reviews (2018) +e ชุดข้อมูลประกอบด้วยบทวิจารณ์ทั้งหมด 938,261 รายการ โดยในจำนวนนี้ 47,901 รายการเป็นผลิตภัณฑ์ที่ไม่ซ้ำใคร และ 153,124 รายการเป็นบทวิจารณ์ที่ไม่ซ้ำของผู้ใช้ +e ชุดข้อมูลในขั้นต้นประกอบด้วย 7 คอลัมน์ กล่าวคือ การให้คะแนนซึ่งแตกต่างกันไปตั้งแต่ 1 ถึง 5 เวลาในการวิจารณ์ รหัสผู้วิจารณ์ รหัสผลิตภัณฑ์ และสรุปข้อความบทวิจารณ์

หลังจากทิ้งรายการที่ซ้ำกัน ชุดข้อมูลจะประกอบด้วยบันทึก 938254 รายการ และตารางที่ 2 จะแสดงข้อมูลโค้ดของชุดข้อมูลต้นฉบับ

3.2. ระเบียบวิธี เราได้ฝึกอบรม word2vecmodel ของเราแบบกำหนดเองเพื่อใช้กับโมเดล LSTM สำหรับการจำแนกประเภท Word2vec เป็นคำที่ฝังไว้ซึ่งใช้เพื่อแสดงคำโดยชุดของคำศัพท์หลายคำของเวกเตอร์ มันอยู่ห่างจากการแมปคำลงในปริภูมิเวกเตอร์ +e ชุดข้อมูลถูกโหลดลงในกรอบข้อมูลแพนด้า สำหรับการพัฒนาโมเดล customword2vec ขั้นตอนแรกคือการประมวลผลข้อมูลล่วงหน้า

เราจะดูเฉพาะการให้คะแนนและข้อความวิจารณ์แล้วทิ้งอย่างอื่นไป +e ข้อความถูกล้างโดยการลบเครื่องหมายวรรคตอน ตัวอย่างข้อความย่อยถูกสร้างขึ้นจากเกือบ 200,000 บทวิจารณ์ และใช้วิธีการเขียนข้อความที่สะอาดตาเพื่อแปลงบทวิจารณ์ทั้งหมดให้เป็นรายการคำ +is รายการคำตอนนี้ทำหน้าที่เป็นอินพุตของโมเดล genism word2vec

เราได้สร้างโมเดล word2vec แบบข้ามแกรมที่ผ่านการฝึกอบรมแบบกำหนดเอง และสร้างอินสแตนซ์ของโมเดลด้วยขนาด: ขนาดของเวกเตอร์คำเป็น 100, ขนาดหน้าต่างเท่ากับ 15, ขั้นต่ำ_นับเป็น 2 สำหรับคำที่ปรากฏน้อยกว่า 2 ครั้งในคลังข้อมูลของเรา ลบเท่ากับ 5 และอัตราการสุ่มตัวอย่างเท่ากับ 1e−5 เราใช้มิติเหล่านี้ทั้งหมดเพื่อสร้างคำศัพท์จากประโยคทบทวนของเรา

increase memory

เราฝึกโมเดล word2vec ของเราเป็นเวลา 1000 ยุค +en เราคำนวณการสูญเสียในทุกยุคสมัย +e การสูญเสียมีสูงในช่วงเริ่มต้นและจะลดลงในช่วงยุคสุดท้าย +e loss atepoch 0 คือ 2239394.0 และการสูญเสียที่ epoch 1000 คือ 11504.0 จากนั้น +e โมเดลที่บันทึกไว้จะถูกโหลดซ้ำและดำเนินการกับโมเดลนั้น

ตัวอย่างเช่น หากเราต้องการค้นหาคำที่คล้ายกับเสียงรบกวนในชุดข้อมูลของเรา เราก็จะได้รับการยกเลิกและหูฟัง

ในทำนองเดียวกัน เรายังพบความคล้ายคลึงกันระหว่างคำบางคำ เช่น หูฟัง และ หูฟัง ซึ่งก็คือ {{0}}.48756 และความคล้ายคลึงระหว่างคำชาร์จและเครื่องชาร์จคือ 0.89264

เพื่อลดขนาดของข้อมูล เราได้ใช้การแสดงภาพ TSNE เพื่อลงจุดข้อมูลเป็นสองมิติ ขณะนี้ เวกเตอร์คำเหล่านี้สามารถใช้สำหรับการจำแนกประเภทเพิ่มเติมได้ +การฝังเหล่านี้จะถูกใช้เป็นคุณสมบัติสำหรับการสตรีมครั้งต่อไป

3.2.1. การเตรียมข้อมูลสำหรับ LSTM ชุดข้อมูลของเราประกอบด้วยบันทึก 938254 รายการ โดยบทวิจารณ์ส่วนใหญ่มีคะแนนการแจกแจงมากกว่า 3 รายการ ก่อนอื่นเราได้คำนวณจำนวนคำสำหรับการทบทวนแต่ละครั้ง +e ค่าเฉลี่ย ถูกใช้เป็นสถิติเพื่อค้นหาความยาวเฉลี่ยของบทวิจารณ์ +e ความยาวเฉลี่ยของการรีวิวคือ 44.59 และความยาวสูงสุดคือ 4303

เราได้สร้างชุดข้อมูลที่ประกอบด้วยบทวิจารณ์ที่มีคำไม่เกิน 100 คำ บทวิจารณ์ที่มีความยาวมากกว่า 20 แต่น้อยกว่า 100 จะถูกจัดหมวดหมู่ภายใต้บทวิจารณ์สั้น ๆ และบทวิจารณ์ที่จัดหมวดหมู่ใหม่ภายใต้บทวิจารณ์ขนาดยาว +e จำนวนบทวิจารณ์สั้นคือ 411313 และบทวิจารณ์แบบยาวคือ 100239 ไฮเปอร์พารามิเตอร์ที่ใช้ในแบบจำลองได้อธิบายไว้ในตารางที่ 3

ต่อไป เราได้กำหนดคะแนนความเชื่อมั่นเป็นบวก หากคะแนนมากกว่าหรือเท่ากับ 3 มิฉะนั้นอันดับจะเป็นลบ เราได้พิจารณาข้อความวิจารณ์และความคิดเห็นในการสร้างชุดข้อมูลรถไฟแล้ว ข้อมูลการทดสอบ +e ประกอบด้วยผลิตภัณฑ์ที่มีการรีวิวอย่างน้อย 10 รายการ

หลังจากการแจกจ่าย ชุดข้อมูลการฝึกอบรมประกอบด้วยบันทึกทั้งหมด 203891 รายการ โดยในจำนวนนี้ 175910 รายการอยู่ในประเภทเชิงบวก และ 27981 รายการอยู่ในประเภทเชิงลบ ชุดข้อมูลการทดสอบ +e ประกอบด้วยบันทึกทั้งหมด 686345 รายการ โดย 592118 รายการอยู่ในกลุ่มค่าบวก และ 94227 รายการอยู่ในคลาสเชิงลบ

ในการศึกษานี้ เราได้ใช้ Keras เพื่อสร้างโมเดล LSTM ของเรา ซึ่งใช้คุณลักษณะสูงสุด 50,000 เป็นอินพุตไปยังเลเยอร์ที่ฝัง หน่วยความจำระยะสั้นแบบยาว (LSTM) เป็นโครงข่ายประสาทเทียมประเภทหนึ่งที่ใช้กลไกภายในที่ควบคุมการไหลของข้อมูล+เป็นกลไกภายในประกอบด้วยประตูที่จำเป็นต้องกักขังเพื่อให้สามารถกรองข้อมูลที่ไม่เกี่ยวข้องออกได้อย่างแม่นยำและเก็บรักษาข้อมูลที่เป็นประโยชน์

ways to improve brain function

รูปที่ 3 แสดงสถาปัตยกรรมพื้นฐานของแบบจำลอง LSTM ในวิธีการที่เรานำเสนอ

Ht−1 และ Xt เป็นอินพุตของหน่วย LSTM Ht−1 หรือที่เรียกกันทั่วไปว่าหน่วยความจำระยะสั้น จะนำเอาท์พุตจากสถานะก่อนหน้ามาเป็นอินพุต +e memorycell หรือหน่วยความจำระยะยาว Ct −1 ช่วยในการนำข้อมูลที่เกี่ยวข้องไปตลอดกระบวนการของลำดับ สถาปัตยกรรม +eLSTM รวมสามประตูเข้าด้วยกัน: ลืมเกต เกตอินพุต และเกตเอาท์พุต ในหน่วย LSTM จะใช้ฟังก์ชัน tanh และ sigmoid เพื่อรับเกตเหล่านี้

จากนั้นข้อมูล +e รถไฟจะถูกแบ่งออกเป็นข้อมูลรถไฟและข้อมูลการตรวจสอบที่มีความยาวเท่ากัน +e ความยาวของข้อมูลคำนวณเป็น 101945 และการกระจายคลาสคือ {1: 87955, 0:13990} ในการสร้างชุดข้อมูลการทดสอบและการตรวจสอบความถูกต้องของรถไฟ TensorFlow เราจำเป็นต้องแปลงข้อมูลรถไฟของเราเป็นลำดับ เราได้เสริมพวกมันให้มีความยาวสูงสุด 100 เพื่อให้ลำดับทั้งหมดมีความยาวเท่ากัน +e ฝึกและทดสอบฉลาก

improve your memory


For more information:1950477648nn@gmail.com



คุณอาจชอบ