Post Reply 
 
Thread Rating:
  • 0 Votes - 0 Average
  • 1
  • 2
  • 3
  • 4
  • 5
Povlačenje sadržaja
Author Message
danielvast Offline
Forumaš
***

Posts: 424
Joined: Dec 2009
Reputation: 22
Post: #21
RE: Povlačenje sadržaja
Tetrapak Wrote:PS. Samo jedno pitanje - Da li je i za phyton dovoljan xamp?
Nisam siguran mislim da je xampp ima podrsku za php i pearl za python nisam siguran siguran sam da ima neki tut kako configurirati xampp za Pyton ali sve ces to morati rucno raditi!

"When all else fails, read the manual."
01-07-2010 05:00 PM
Find all posts by this user Quote this message in a reply
Gogy Offline
____
*

Posts: 2,311
Joined: Feb 2006
Post: #22
RE: Povlačenje sadržaja
Za Python skini neki od ovih i to je to
http://www.python.org/download/

Pravila foruma | Twitter - Facebook - Google+ |


Radar404 <- moj blog
01-07-2010 05:48 PM
Visit this user's website Find all posts by this user Quote this message in a reply
Tetrapak Offline
Redoviti posjetitelj
**

Posts: 119
Joined: Jun 2010
Reputation: 6
Post: #23
RE: Povlačenje sadržaja
Bok! Evo meneHe he
Išao sam prvo na ovu jednostavniju varijantu (preko simple parsera)
uglavnom, skužio sam kako sve ide (valjda) instalirao i krenuo na posao:
PHP Code:
<?php
include_once('simple_html_dom.php');

// Create a DOM object from a URL
$html file_get_html('http://www.rezultati.com/nogomet/svjetsko-prvenstvo/');

// Find all element has attribute fs
$ret $html->find('[fs]');

// Extract contents from HTML 
echo $html->plaintext;
?>

Do tu je ok, ovo mi vrati mi sve što se nalazi na stranici (znači ono što je vezano uz html, tj.sve osim slika i tabele zbog koje ovo i radim). Pretpostavljam i zašto (zbog ovog $html->plaintext)...
Logički mi je da to zamijenim tako da mi vraća rezultat varijable $ret:

PHP Code:
// Extract contents from HTML 
echo $ret->plaintext

Ali tu mi vrati kao rezultat:
Notice: Trying to get property of non-object in D:\wamp\www\index.php on line 11
što me vodi do zaključka da je tablicu nemoguće izvaditi ovim putem (inače bi to i excel query mogao).

Trebam potvrdu da je to istina, pa da mogu krenuti na Phyton... Hmmm
05-07-2010 04:47 PM
Visit this user's website Find all posts by this user Quote this message in a reply
danielvast Offline
Forumaš
***

Posts: 424
Joined: Dec 2009
Reputation: 22
Post: #24
RE: Povlačenje sadržaja
Pa možes pokusati i sa python-om definitivno češ napisati više od par linija koda da izvučeš podatke ali ti to ne garantira uspjeh ti zapravo pokušavaš izvući podatke sa stranice koja se nalazi u iframe-u, naravno postoji razlog zbog kojeg excel query ne može učitiati zato što svi podatci su učitani preko DOM sučelja pomoću XML datoteke ili JSON variabli!

"When all else fails, read the manual."
05-07-2010 09:03 PM
Find all posts by this user Quote this message in a reply
Tetrapak Offline
Redoviti posjetitelj
**

Posts: 119
Joined: Jun 2010
Reputation: 6
Post: #25
RE: Povlačenje sadržaja
Postoji li još koji način za uključiti sadržaj u html osim iframe?
(This post was last modified: 06-07-2010 08:26 PM by Tetrapak.)
06-07-2010 07:48 PM
Visit this user's website Find all posts by this user Quote this message in a reply
danielvast Offline
Forumaš
***

Posts: 424
Joined: Dec 2009
Reputation: 22
Post: #26
RE: Povlačenje sadržaja
Mozes preko ajax-a ali trebas poznavati malo javascript-a imas ovdje dobar tutorial link

"When all else fails, read the manual."
(This post was last modified: 06-07-2010 08:43 PM by danielvast.)
06-07-2010 08:42 PM
Find all posts by this user Quote this message in a reply
kecko Offline
Forumaš
***

Posts: 647
Joined: Nov 2009
Reputation: 20
Post: #27
RE: Povlačenje sadržaja
Nemožeš preko ajaxa pozivati stranice koje nisu na tvom serveru Namigivanje) Jedino da čitaš s phpom na svojoj stranici pa opet onda ispisuješ to isto, a koliko vidim to ne ide kod tebe, tak da prek toga ne može :)
07-07-2010 10:06 AM
Find all posts by this user Quote this message in a reply
zero Offline
Forumaš
***

Posts: 462
Joined: Jan 2008
Reputation: 10
Post: #28
RE: Povlačenje sadržaja
hana... Ti si u ovom drugom pokusaju htio napraviti nesto s varijablom sto se moze samo sa class-om. Trenutno lezim u krevetu i ovo tipkam na mobu, pa ti ne mogu napisati kod. Ovo $html-find('[fs]') promjeni tako da trazi id od div-a u kojem se nalazi tablica na toj stranici. I onda u sljedecu liniju napises:
echo $ret;
Palac-gore

Brzo. Jeftino. Kvalitetno. Izaberi dva!
07-07-2010 11:44 AM
Find all posts by this user Quote this message in a reply
Tetrapak Offline
Redoviti posjetitelj
**

Posts: 119
Joined: Jun 2010
Reputation: 6
Post: #29
RE: Povlačenje sadržaja
Probao sam i to, ali mi uvijek vraća: Array.
Mislim da ne prikazuje ništa zato što sadržaj sa tog linka spada pod iframe.
Zatim sam probao ići na direktan link "http://www.rezultati.com/iframe/sport.php?sport=soccer&category=46&serial=695", i opet mi vraća Array.
Zaključujem da je to zato što nisam prošao autorizaciju.

Uglavnom, našao sam način kako da zaobiđem autorizaciju, ali samo ako ovaj gornji link uključim u iframe, što znači da mu opet ne mogu pristupiti parsiranjem (ako sam sve dobro skužio, to je zato što je iframe "stranica u stranici").

Znači trebao bi zaobići autorizaciju i ujedno uključiti gornji link, ali ne preko iframea nego na neki drugi način tako da se sadržaj učita direktno, a ne posredno, kako bi mu mogao pristupiti parserom.
Ima ko kakav prijedlog :)

Ps. autorizacija se zaobilazi javascriptom.
(This post was last modified: 07-07-2010 12:14 PM by Tetrapak.)
07-07-2010 12:03 PM
Visit this user's website Find all posts by this user Quote this message in a reply
Tetrapak Offline
Redoviti posjetitelj
**

Posts: 119
Joined: Jun 2010
Reputation: 6
Post: #30
RE: Povlačenje sadržaja
Evo da pojasnim ovo za autorizaciju:
Izvor tabele (npr. ovaj - http://www.rezultati.com/iframe/sport.ph...rial=695), traži podatke od onoga tko mu želi pristupiti sa ovom skriptom:
PHP Code:
<script type="text/javascript"
//<![CDATA[
    
document.domain 'rezultati.com';
    var 
page_utime 1278497800;
    var 
tudate 1278460800;
    var 
mid_s 1;
    var 
odds_enable    true;
    var 
odds_1xx2 true;
    var 
fsstat_enable true;
    var 
custom_enable true;
    var 
iframe_external false;
    var 
local_tz 2;
    var 
hover_color null;
    var 
mpe_alias 'p1, p2';
    var 
mpe_delivery 'p';
    var 
service_status '1';
 
    if(
this.attachEvent)
        
this.attachEvent("onload", function() { init('soccer'460true); });
    else
        
this.onload = function() { init('soccer'460true); };
//]]>
</script> 
a onaj tko mu želi pristupiti mora na svojoj stranici imati ovaj kod:
PHP Code:
<html>
<
script type="text/javascript"
//<![CDATA[
    
document.domain 'rezultati.com';
    
document.ifa = function() { return true }
//]]>
</script> 
<iframe name="livescoreContent" id="livescoreContent" src="http://www.rezultati.com/iframe/sport.php?sport=soccer&category=46&serial=695" width="100%" height="100%" frameborder="0" marginwidth="0" marginheight="0" scrolling="no" class="livescoreIframe">
</html> 
i najbitnije, da bi radilo ime domene mu mora biti "rezultati.com".

Nadam se da je sada jasnije.

PS. došao sam na ideju da bi išlo preko php funkcije include ali ne znam kako integrirati javascriptu u php (mislio sam da ide kao i kod html <script type="text/javascript"> ... </script>, ali mi izbacuje error).
(This post was last modified: 07-07-2010 12:45 PM by Tetrapak.)
07-07-2010 12:28 PM
Visit this user's website Find all posts by this user Quote this message in a reply
Post Reply 


Forum Jump:


User(s) browsing this thread: 1 Guest(s)