85.人工智能——PyQt+圖像文字識別 _圖像

前面有講在窗體上如何滾動顯示大尺寸圖像，具體可以參看：84.——使用PyQt的滾動顯示大尺寸圖像。有網友留言能否做一個識別圖像中的文字。
本文就在上一篇的程序基礎上增加一個圖像文字識別功能人工智能圖像識別技術，并保存識別結果到文本文件中。
界面設計
整個垂直布局，分上，中，下三個區域，上區域一個和+Label用來顯示圖像。中間區域用文本框來顯示識別結果。下面一個功能按鈕人工智能圖像識別技術，一個識別、一個保存。文本框高度設定為窗體的四分之一。
UI
功能實現
功能：
1、默認打開獲取當前目錄中的所有圖像，點擊選擇文件夾項，可以選擇任意目錄。
2、單擊圖像文件名，可以顯示整幅圖像，點擊圖像，可以在圖像展示區按比例縮放整個圖像。（窗口可以自適應改變大?。?
3、對打開的當前圖像進行文字識別（這里使用的是）
4、保存文字識別結果
代碼：
import sysimport osfrom PyQt5 import QtCore, QtGui,QtWidgetsfrom Ui_picocr import Ui_MainWindowimport paddleocrimport numpy as npclass MainWindow(QtWidgets.QMainWindow,Ui_MainWindow):def __init__(self):super().__init__()self.setupUi(self)self.imgname=""self.npimg=np.array([])#設置圖片控件的雙擊事件self.lblimg.mousePressEvent=self.img_scale#圖像列表框按鍵事件self.lstimg.keyPressEvent=self.on_lstimg_keyPressEvent#文字識別按鈕點擊事件self.btnocr.clicked.connect(self.on_btnocr_clicked)#保存按鈕點擊事件self.btnsave.clicked.connect(self.on_btnsave_clicked)#設置圖片控件文本提示self.lblimg.setToolTip("雙擊自動調整大小")#獲取當前目錄curdir=os.path.abspath(os.curdir)#獲取當前目錄下的所有圖片文件lstimg=["選擇文件夾"]for root,dir,file in os.walk(curdir):for f in file:if os.path.splitext(f)[1] in ['.jpg','.png','.bmp']:lstimg.append(os.path.join(root,f))#把圖片文件列表放到listview中slm=QtCore.QStringListModel()slm.setStringList(lstimg)self.lstimg.setModel(slm)#設置txtedit高度self.txtedit.setFixedHeight(self.height()//4)#圖片列表單擊事件def on_lstimg_clicked(self,index):#獲取當前圖片文件名self.imgname=self.lstimg.model().stringList()[index.row()]if self.imgname=="選擇文件夾":#打開選擇文件夾對話框dirname=QtWidgets.QFileDialog.getExistingDirectory(self,'選擇文件夾')lstimg=["選擇文件夾"]for root,dir,file in os.walk(dirname):for f in file:if os.path.splitext(f)[1] in ['.jpg','.png','.bmp']:lstimg.append(os.path.join(root,f))#把圖片文件列表放到listview中slm=QtCore.QStringListModel()slm.setStringList(lstimg)self.lstimg.setModel(slm)else:#獲取圖像的寬高img=QtGui.QImage(self.imgname)h,w,c=img.height(),img.width(),img.format()#QImage圖像格式轉換為cv2圖像格式########### Format_RGB32 = 4,存入格式為B,G,R,A 對應 0,1,2,3# RGB32圖像每個像素用32比特位表示，占4個字節，# R，G，B分量分別用8個bit表示，存儲順序為B，G，R ，最后8個字節保留img2bgr=img.convertToFormat(QtGui.QImage.Format_RGB32)ptr=img2bgr.bits()ptr.setsize(img2bgr.byteCount())self.npimg=np.array(ptr,dtype=np.uint8).reshape(h,w,4)#去掉alpha通道BGRself.npimg=self.npimg[:,:,:3]#設置scrollarea的滾動范圍和自動調整大小self.scrollAreaWidgetContents.setMinimumSize(w,h)#設置圖像控件的寬高self.lblimg.setFixedSize(w,h)#顯示圖片self.lblimg.setPixmap(QtGui.QPixmap.fromImage(QtGui.QImage(self.imgname)))self.statusBar().showMessage(self.imgname)#圖像列表框按鍵事件def on_lstimg_keyPressEvent(self,event):if event.key()==QtCore.Qt.Key_Down or event.key()==QtCore.Qt.Key_Up:self.lstimg.setCurrentIndex(self.lstimg.currentIndex().sibling(self.lstimg.currentIndex().row()+1,0))self.on_lstimg_clicked(self.lstimg.currentIndex())#圖像控件雙擊事件def img_scale(self,event):#設置大小為滾動區域的大小self.lblimg.setFixedSize(self.scroll.width(),self.scroll.height())#設置圖像大小自適應控件大小self.lblimg.setPixmap(QtGui.QPixmap.fromImage(QtGui.QImage(self.imgname)).scaled(self.lblimg.width(),self.lblimg.height(),QtCore.Qt.KeepAspectRatio))#ocr按鈕事件def on_btnocr_clicked(self):ocr=paddleocr.PaddleOCR(use_angle_cls=True,lang="ch")result=ocr.ocr(self.npimg)boxes=[]txts=[]scores=[]for line in result:boxes.append(line[0])txts.append(line[1][0])scores.append(line[1][1])self.txtedit.setText("n".join(txts))def on_btnsave_clicked(self):#保存文本,打開保存文本對話框filename=QtWidgets.QFileDialog.getSaveFileName(self,'保存文本','','Text Files(*.txt)')with open(filename[0],"w") as f:f.write(self.txtedit.toPlainText())self.statusBar().showMessage("保存成功")if __name__ == '__main__':app=QtWidgets.QApplication(sys.argv)window=MainWindow()window.setWindowTitle("picocr")window.show()sys.exit(app.exec_())
注意：
1、列表響應箭頭按鍵事件
#圖像列表框按鍵事件 self.lstimg.keyPressEvent=self.on_lstimg_keyPressEvent
2、圖像格式轉為cv2圖像格式。文字識別傳入的圖像參數img: img for ocr,,and list or。所以這里也可以直接使用。
#QImage圖像格式轉換為cv2圖像格式########### Format_RGB32 = 4,存入格式為B,G,R,A 對應 0,1,2,3# RGB32圖像每個像素用32比特位表示，占4個字節， # R，G，B分量分別用8個bit表示，存儲順序為B ， G，R ，最后8個字節保留img2bgr=img.convertToFormat(QtGui.QImage.Format_RGB32)ptr=img2bgr.bits()ptr.setsize(img2bgr.byteCount())self.npimg=np.array(ptr,dtype=np.uint8).reshape(h,w,4)#去掉alpha通道BGRself.npimg=self.npimg[:,:,:3]
運行效果
結果1
結果2
【85.人工智能——PyQt+圖像文字識別】本文到此結束，希望對大家有所幫助。

继夫的玩弄H辣文的小说|女人与拘性猛交视频|精品欧美高清不卡高清|一起做亏亏的事情的视频|啦啦啦在线视频观看|望月直播下载ios版本|国产日韩欧美一区二区三区

85.人工智能——PyQt+圖像文字識別