Čitanje datoteke: datoteka dobiva sadržaj (PHP)

. Navedeni navedeni URL. Zapravo, stranica

je predstavljena PHP phpinfo () konstruktom, tj. Tekst iz tri retka se ne čita i rezultat je te funkcije.
Kao što se može vidjeti, rezultat je potpuna stranica, dok PHP dobiva sadržaj sadržaja datoteke na http (http) je pročitao i zabilježio unutarnji sadržaj ove stranice u varijabli $ cLine.

Opcije i postavke konteksta

Treba imati na umu da korištenje parametra $ context otvara velike mogućnosti.
U normalnoj praksi, korištenje svih parametara osim $ filename nije popularno pravilo. Međutim, vrijednost je stvorenaStruktura stream_context_create () i koristi se kao parametar $ context, omogućuje vam pisanje vrlo složenih algoritama za dobivanje potrebnih informacija. Različiti sustavi datoteka, omotači zahtijevaju različite postavke i opcije za opisivanje konteksta. Može se izraditi pomoću konstrukata stream_context_create (stream_context_set_option, stream_context_set_params).

Masovna obrada stranica

Umjesto specifične URL adrese, parametar $ filename može se predstaviti nazivom varijable. To vam omogućuje da analizirate sadržaj stranica u automatskom programabilnom načinu rada, saznate nazive stranica, odredite linkove, dobijete informacije koje su vam potrebne.

Možete stvoriti vlastiti parser, web-pretraživač i pisati distribuirane programe za obradu informacija. Zadatak je stvaran, zanimljiv i praktičan.

Čitanje tekstualnih datoteka

Nema problema što točno čitati datoteku. U sljedećem složenom dizajnu, sadržaj datoteke php je primjer činjenice da se datoteka "vordovsky" može čitati bez problema:
Ovdje je složen dokument koji se koristi za testiranje knjižnice PHPOffice /PHPWord. Datoteka MS Word (* .docx) poznata je kao zip arhiva, unutar koje se informacije temelje na standardu Open XML. Tipično, datoteke dokumenata su dovoljno velike i komplicirane, ali datoteka dobiva strukturu sadržaja PHP može bez poteškoća obraditi njihovo čitanje. Specifičnost ovog primjera je da je obrada dokumenata isključivo sredstvo PHPOffice /PHPWord knjižnice, što vam ne dopušta dobivanje potrebnih mogućnosti, i jednostavno nije moguće slijedno čitanje datoteke. uDati dokument svi njegovi elementi (riječi, paragrafi, formule, crteži, elementi pravopisa) opisani su nizom oznaka, a neki mogu biti predstavljeni nizom ugniježđenih objekata.
Ako uzmemo primjer dokumenta (* .docx) s tablicama, situacija se uopće ne rješava ako datoteku obrađujete sukcesivno. Zahtijeva najmanje dvije staze kroz tijelo dokumenta, ako, na primjer, ne uđete u, primjerice, kada su tablice ugrađene jedna u drugu.

Problemi kodiranja i specijalni znakovi

Ako čitanje složenih datoteka ne uzrokuje probleme, onda je problem raditi s jednostavnim datotekama. Prvo treba uzeti aksiom: struktura datoteke dobiva sadržaj PHP ispravno čita. Čak i ako ne koristite te ili druge parametre, najjednostavnija verzija njezine aplikacije uvijek će raditi kako treba. Poteškoće uzrokuju kutne zagrade i kodiranje datoteka. Rad unutar algoritma treba razlikovati od prikaza rezultata u prozoru preglednika. Redak

- $ cLine = scChangeLTGT ($ cLine) - poziva funkciju pretvaranja para uglovnih zagrada u posebni znak na slici uz primjer datoteke odjela, inače jednostavno čitanje datoteke ne može uvijek biti prikazano u prozoru preglednika. Kako pisati ovu funkciju nije bitno, ali važno je imati na umu da informacije o čitanju mogu sadržavati XML i HTML oznake, a to zahtijeva posebnu pozornost.

Sljedeći trenutak: kodiranje datoteka. Nije uvijek jednostavna tekstualna datoteka ne stvara probleme. Ako se čita tekstualna informacija, prisutnost n slova može stvoriti neke poteškoće
. $ cLine = iconv ('UTF-8', 'CP1251',$ cLine). U tom kontekstu, upotreba funkcije iconv () s ispravnim smjerom pretvorbe nije relevantna samo za PHP, "dobijte sadržaj datoteke http: //" za čitanje stranice web-mjesta, nego i kada se čita regularna lokalna datoteka. Ako rezultat čitanja "nije vidljiv", prvo je provjeriti kodiranje znakova.

Povezane publikacije