วันนี้ผมจึงมานำเสนอเกี่ยวกับ ตัวของวิธีที่ผมได้ทำารการคิดในการแยกคำภาษาไทย อังกฤษและช่องว่าง โดยวิธีการที่ผมคิดจะสามารถนับคำและตัวอักษรแยกกันทั้งภาษาไทย อังกฤษ รวมถึงนับจำนวนช่องว่างได้อีกด้วยครับ เราจะนำเอาตัวของ pythainlp เข้ามาช่วยไนการที่เราจะแยกคำทั้งภาษาไทยงและอังกฤษนะครับ ซึ่งคำในภาษาอังกฤษปกติลักษณะโดยการที่แบ่งคำให้อยู่แล้ว ดังนั้นตรงนี้มองผ่านไปได้เลยครับ เราจะมาดูตัวอย่างโค้ดกันนะครับ
ตัวอย่างโค้ดนะครับ
โค้ด: เลือกทั้งหมด
from pythainlp.tokenize import word_tokenize
output = word_tokenize(Text ที่เรารับเข้ามา, engine="newmm")
countTh = 0
countthai = 0
countE =0
counteng =0
countB =0
print(type(Data.word))
for i in output:
print(i)
countttt = 0
for l in i:
b=l
print(b)
break
if i== " " :
countB +=1
print("ทำงาน")
elif b == "a" or b == "A" or b == "b" or b == "B" or b == "c" or b == "C" or b == "d" or b == "D" or b == "e" or b == "E"or b == "F" or b == "f" or b == "h" or b == "H" or b == "g" or b == "G" or b == "i" or b == "I" or b == "j" or b == "J"or b == "k" or b == "K" or b == "l" or b == "L" or b == "m" or b == "M" or b == "n" or b == "N" or b == "o" or b == "O"or b == "p" or b == "P" or b == "q" or b == "Q" or b == "r" or b == "R" or b == "s" or b == "S" or b == "t" or b == "T"or b == "u" or b == "U" or b == "v" or b == "V" or b == "w" or b == "W" or b == "x" or b == "X" or b == "y" or b == "Y" or b == "z" or b == "Z" :
if i != "\n" :
countttt = len(i)
countE = countttt + countE
counteng = counteng + 1
else :
if i != "\n":
countttt = len(i)
countTh = countttt + countTh
countthai = countthai + 1
สรุป
ตัวอย่างโค้ดข้างต้นที่กล่าวมาก็สามารถที่จะนำไปประยุกต์ใช้ได้ในงานต่างๆครับ เพราะช่วยนับจำนวนคำได้เบื้องต้น นับจำนวนตัวอักษรได้ แถมยังนับว่ามีกี่ช่องว่างได้อีกด้วยอาจจะสามารถนำเอาไปตรวจการบ้านเด็กได้นั่นเองครับผม
อ้างอิง
https://www.bualabs.com/archives/3234/what-is-pythainlp-tutorial-teach-basic-how-to-use-pythainlp-library-nlp-in-python-pythainlp-ep-1/
https://th.wikipedia.org/wiki/%E0%B8%A0%E0%B8%B2%E0%B8%A9%E0%B8%B2%E0%B9%84%E0%B8%97%E0%B8%A2
https://th.wikipedia.org/wiki/%E0%B8%A0%E0%B8%B2%E0%B8%A9%E0%B8%B2%E0%B8%AD%E0%B8%B1%E0%B8%87%E0%B8%81%E0%B8%A4%E0%B8%A9