Witam
Mam pewien problem. Potrzebuje z poziomu aplikacji WWW (czy to PHP i funkcji do obslugi socketow, czy JavaScript i obiektu XMLHttpRequest) zasymulowac pelne wejscie na strone. Pelne - tzn. takie, ktore w logach bedzie identycznie prezentowane jak wejscie z normalnej przegladarki. Pomijam kwestie naglowkow User-Agent itd. Chodzi mi mianowicie o to, ze aktualnie wejscie w logach wyglada w nastepujacy sposob:
Czyli prezentowanie jest pobranie tylko tresci strony glownej. A dla przykladu wejscie na ta sama strone z poziomu przegladarki wyglada nastepujaco:Kod:user1234.host.pl - - [24/Jul/2008:03:26:55 +0200] "GET / HTTP/1.1" 200 1320 "http://user1234.host.pl/index.php" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14"
A wiec przegladarka pobiera dodatkowo CSS, grafike, favico itd. Ale pobiera to tak sprytnie, ze wszedzie jest jako REFERER Page wpisana nazwa strony, na ktora nastapilo wejscie.Kod:user1234.host.pl - - [24/Jul/2008:01:20:47 +0200] "GET / HTTP/1.1" 200 1320 "-" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14" user1234.host.pl - - [24/Jul/2008:01:20:48 +0200] "GET /style.css HTTP/1.1" 200 1316 "http://user1234.host.pl/index.php" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14" user1234.host.pl - - [24/Jul/2008:01:20:48 +0200] "GET /images/welcome.gif HTTP/1.1" 200 522 "http://user1234.host.pl/index.php" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14"
Teraz pytanie? Czy da sie zasymulowac z poziomu czystego wejscia na strone, nawet telnetujac port 80 i wysylajac naglowki w jakis sposob takie wejscie? Czy pobieranie tych wszystkich pozostalych elementow na stronie to jest jakas wewnetrzna funkcja przegladarki i zwiazane to jest z jej budowa i dzialaniem? A moze to kwestia wysylanych naglowkow i jakiejs opcji "podtrzymania" polaczenia i podazania za odnosnikami i ich pobierania?
Dodam tylko, ze w logach czasami mam wejscia Yahoo i innych robotow, i sa to wejscia prezentowane tak, jakby wejscie nastapilo z normalnej przegladarki (czyli opisana wersja 2ga) - pomijajac User-Agent, ktory wskazuje na to, ze jest to pajak.
Z gory dzieki za informacje!