สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

Post a reply

Smilies
:icon_plusone: :like: :plusone: :gfb: :-D :) :( :-o 8O :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: :angry: :baa: :biggrin:
View more smilies

BBCode is ON
[img] is ON
[flash] is OFF
[url] is ON
Smilies are ON

Topic review
   

Expand view Topic review: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by Naluebed Oneselfz » 09/06/2017 4:33 pm

อันนี้แก้ไฟล์ไหนหรอครับที่เพิ่ม encoding ลงไปอะครับ

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by Naluebed Oneselfz » 09/06/2017 4:30 pm

อันนี้แก้ในไฟล์ไหนหรอครับที่เพิ่ม encoding ลงไปอะครับ

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by touleg » 23/08/2011 10:05 pm

เรียบร้อยได้แล้วครับ ความพยายามอยู่ที่ไหนความพยายามอยู่ที่นั่น เอ้ยความสำเร็จ

Code: Select all

<?php
	$filename = "541170301.pdf";
	$content = exec('C:\AppServ\www\pdftotextphp\pdftotext.exe '.$filename.'');
	echo $content;
?>
ถ้าเอาไฟล์ pdftotext มาไว้ที่เดี๋ยวกับไฟล์เว้บเราก็เรียกแบบนี้ได้เลย

Code: Select all

<?php
	$filename = "541170301.pdf";
	$content = exec('pdftotext.exe '.$filename.'');
	echo $content;
?>
ขอบคุณมากครับ

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by mindphp » 23/08/2011 9:55 pm

ที่ผมเคยทำผมจะ exec() แปลง เป็นไฟล์ text แล้ว php อ่านไฟล์ text มาใช้อีกทีหนึ่ง

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by touleg » 23/08/2011 9:24 pm

http://loewyi.com/info/pdftotext-php-xpdf/

เค้าใช้แค่นั้นก็ใช้ได้แล้ว แต่ผมใช้ไม่ได้เหอะๆๆ

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by touleg » 23/08/2011 9:06 pm

ก็ถูกนะครับ ลองรันกับ cmd ของ window ก็ใช้ได้นะครับ

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by mindphp » 23/08/2011 8:59 pm

รูปแบบการใช้งาน

Code: Select all

pdftotext [options] [PDF-file [text-file]]

OPTIONS
-f number
Specifies the first page to convert.

-l number
Specifies the last page to convert.

-layout
Maintain (as best as possible) the original physical layout of
the text. The default is to 'undo' physical layout (columns,
hyphenation, etc.) and output the text in reading order.

-fixed number
Assume fixed-pitch (or tabular) text, with the specified charac-
ter width (in points). This forces physical layout mode.

-raw Keep the text in content stream order. This is a hack which
often "undoes" column formatting, etc. Use of raw mode is no
longer recommended.

-htmlmeta
Generate a simple HTML file, including the meta information.
This simply wraps the text in <pre> and </pre> and prepends the
meta headers.

-enc encoding-name
Sets the encoding to use for text output. The encoding-name
must be defined with the unicodeMap command (see xpdfrc(5)).
The encoding name is case-sensitive. This defaults to "Latin1"
(which is a built-in encoding). [config file: textEncoding]

-eol unix | dos | mac
Sets the end-of-line convention to use for text output. [config
file: textEOL]

-nopgbrk
Don't insert page breaks (form feed characters) between pages.
[config file: textPageBreaks]

-opw password
Specify the owner password for the PDF file. Providing this
will bypass all security restrictions.

-upw password
Specify the user password for the PDF file.

-q Don't print any messages or errors. [config file: errQuiet]

-cfg config-file
Read config-file in place of ~/.xpdfrc or the system-wide config
file.

-v Print copyright and version information.

-h Print usage information. (-help and --help are equivalent.)

Re: สอบถามผู้รู้ แปลง PDF เป็น text หรือ HTML

by touleg » 23/08/2011 8:52 pm

ลองทำแล้วปรากฎว่าสามารถรันได้ แต่ได้ไฟล์ว่างเปล่า ที่มีชื่อว่า pdftotext ไม่มีนามสกุล

ผมเก็บไฟล์ไว้ตามนี้ครับ
C:/xpdf
C:/Appserv/pdftotextphp/test.php
C:/Appserv/pdftotextphp/0405601501.pdf

Code: Select all

<?php
	$filename = "0405601501.pdf";
	$content = exec('C:\Program Files\xpdf>pdftotext '.$filename.'');
	echo $content;
?>

Top