Converter arquivo XLSX para Texto
Códigos
340 visualizações
Códigos
340 visualizações

Converter arquivo XLSX para Texto

Solange Gamboa - 28 de agosto de 2012

Essa função em PHP converte um arquivo do Office .XLSX para texto puro, utilizando uma classe desenvolvida por Sergey Schuchkin em http://www.sibvison.ru.

Códigos
405 visualizações

Converter arquivo XLS para Texto

Solange Gamboa - 24 de agosto de 2012

Essa função em PHP converte um arquivo do Office .XLS para texto puro, utilizando uma classe desenvolvida por Matt Kruse em http://code.google.com/p/php-excel-reader/.


Converter arquivo DOC ou PPT para texto puro
Códigos
344 visualizações
Códigos
344 visualizações

Converter arquivo DOC ou PPT para texto puro

Solange Gamboa - 23 de agosto de 2012

As seguintes funções convertem documentos do Office (.DOC ou .PPT) para texto puro, usando linguagem PHP.

Função DOC2Text:

/*** Converte DOC para Texto Limpo*
@param filename: Caminho do arquivo*/
function DOC2Text($filename) { $fileHandle = fopen($filename, "r"); $line = @fread($fileHandle, filesize($filename)); $lines = explode(chr(0x0D),$line); $outtext = ""; foreach($lines as $thisline) { $pos = strpos($thisline, chr(0x00)); if (($pos !== FALSE)||(strlen($thisline)==0)) { } else { $outtext .= $thisline." "; } } $outtext = preg_replace("/[^a-zA-Z0-9s,[email protected]/_()]/","",$outtext); return $outtext;}

Modo de Uso:

$doc_content = DOC2Text('/tmp/meudoc.doc');
echo "$doc_content";


Função PPT2Text:

/*** Converte PPT para Texto Limpo*
@param filename: Caminho do arquivo*/

function PPT2Text($filename) {
// Esta abordagem utiliza a detecção da string "chr(0f).Hex_value.chr(0x00).chr(0x00).chr(0x00)" para identificar strings de texto, que são então fechadas com outro NUL chr(0x00) e captura o texto entre os delimitadores
$fileHandle = fopen($filename, "r");
$line = @fread($fileHandle, filesize($filename));
$lines = explode(chr(0x0f),$line);
$outtext = '';

foreach($lines as $thisline) {
if (strpos($thisline, chr(0x00).chr(0x00).chr(0x00)) == 1) {
$text_line = substr($thisline, 4);
$end_pos = strpos($text_line, chr(0x00));
$text_line = substr($text_line, 0, $end_pos);
$text_line = preg_replace("/[^a-zA-Z0-9s,[email protected]/_()]/","",$text_line);
if (strlen($text_line) > 1) {
$outtext.= substr($text_line, 0, $end_pos)."n";
}
}
}
return $outtext;
}

Modo de Uso:

$ppt_content = PPT2Text('/tmp/meuppt.ppt');
echo "$ppt_content";

Converter arquivo PDF para Texto
Códigos
599 visualizações
Códigos
599 visualizações

Converter arquivo PDF para Texto

Solange Gamboa - 14 de agosto de 2012

Esta função permite extrair texto puro de um documento em PDF.

Códigos
335 visualizações

Varredura em C

Solange Gamboa - 30 de novembro de 2011

Processo de varredura de um arquivo de C++ onde ele separa por palavras reservadas, identificadores, números, operadores e comentários.