Pokaż wyniki 1 do 10 z 14

Temat: Skrypt przeszukujacy dwa pliki tekstowe i dopisujacy zadane znaki do drugiego pliku

Hybrid View

Previous Post Previous Post   Next Post Next Post
  1. #1

    Exclamation Skrypt przeszukujacy dwa pliki tekstowe i dopisujacy zadane znaki do drugiego pliku

    Czesc
    od kilku dni probuje napisac dosc skomplikowany (jak dla poczatkujacego) skrypt , ktorego zadaniem bedzie przeprowadzanie operacji na dwoch plikach
    a mialo by to wygladac tak:
    operacje są dokonywane na dwóch plikach tekstowych, pierwszy z nich
    jest plikiem tylko do odczytu i wygląda tak :


    1 1 -2.5930E+08 -1.1393E+07 -2.9221E+07 -1.5604E+07 -3.0836E+06 2.6169E+08
    2 1 -1.5113E+08 -5.3081E+06 -6.7720E+07 -7.9690E+06 -7.1801E+06 1.9560E+08
    3 1 -6.1180E+07 -7.6683E+05 -9.4798E+07 -2.5004E+06 -1.0760E+07 1.8449E+08
    4 1 4.4102E+07 9.0110E+06 -7.9293E+07 2.6747E+06 -1.0032E+07 1.4468E+08
    5 1 1.2766E+08 7.3496E+06 -7.5612E+07 8.8286E+06 -1.2019E+07 1.7172E+08
    6 1 3.4349E+08 6.2426E+07 1.6234E+07 2.0982E+07 3.7429E+06 2.4794E+08


    pierwsza liczba w każdej linijce to liczbą porządkową następne to
    parametry, ostatnia to liczna na podstawie której program ma ocenić
    co zrobić z linijka o TYM SAMYM numerze na w drugim pliku tekstowym
    .Drugi plik wygląda tak prawie identycznie jak pierwszy, ma tyle samo
    linijek i 9 kolumn


    1, 93, 297, 20, 1, 1424, 1628, 1351, 1332
    2, 297, 298, 21, 20, 1628, 1629, 1352, 1351
    3, 298, 299, 22, 21, 1629, 1630, 1353, 1352
    4, 299, 300, 23, 22, 1630, 1631, 1354, 1353
    5, 300, 301, 24, 23, 1631, 1632, 1355, 1354
    6, 301, 302, 25, 24, 1632, 1633, 1356, 1355


    Operacja wykonywana przez skrypt ma polegać na odczycie z pierwszego
    pliku liczy porządkowej i porównaniu jej z wcześniej podanym
    parametrem X ( równym np. X=1,2,4,6) jeśli X jest różne od liczby
    porządkowej to należy sprawdzić ostatnia liczbę w linijce i
    porównać ja z Y ( Y ma jedna wartość i jest równe np.
    Y=1.717E+08), jeśli liczba ta jest większa od Y to skrypt powinien
    wprowadzić zmianę w linijce o tym samym numerze w pliku numer dwa -
    zmiana to wstawienie ** na początku linii, tak ze efekt końcowy
    powinien wyglądać tak :
    (plik numer 2)
    1, 93, 297, 20, 1, 1424, 1628, 1351, 1332
    ** 2, 297, 298, 21, 20, 1628, 1629, 1352, 1351
    3, 298, 299, 22, 21, 1629, 1630, 1353, 1352
    4, 299, 300, 23, 22, 1630, 1631, 1354, 1353
    ** 5, 300, 301, 24, 23, 1631, 1632, 1355, 1354
    6, 301, 302, 25, 24, 1632, 1633, 1356, 1355
    plik numer 1 pozostaje niezmieniony
    Wiem ze problem jest skomplikowany(przynajmniej dla mnie), w
    książkach i kursach internetowych nie znalazłem nic co choćby
    przypominało podobny problem .Szukałem tez na forach podobnych
    rozwiązań, niestety bez efektu. Jak do tej pory próbuje
    przekształcić skrypt napisany przez pana Michała Kurka w odpowiedzi
    na mój poprzedni list.
    Czy ktoś byłby w stanie pomoc mi w napisaniu takiego skryptu ?

  2. #2
    Zarejestrowany
    Jun 2006
    Skąd
    rand(.eu)
    Postów
    8,748

    Domyślnie

    Napisać nie problem jak się wie o co chodzi... a zamieszałeś niemiłosiernie :-)

    Cytat Napisał pukas
    pierwsza liczba w każdej linijce to liczbą porządkową następne to
    parametry, ostatnia to liczna na podstawie której program ma ocenić
    co zrobić z linijka o TYM SAMYM numerze na w drugim pliku tekstowym.
    na razie jasne...

    Cytat Napisał pukas
    Drugi plik wygląda tak prawie identycznie jak pierwszy, ma tyle samo
    linijek i 9 kolumn
    [...]
    Operacja wykonywana przez skrypt ma polegać na odczycie z pierwszego
    pliku, liczy porządkowej i porównaniu jej z wcześniej podanym
    parametrem X ( równym np. X=1,2,4,6) jeśli X jest różne od liczby
    porządkowej to należy sprawdzić ostatnia liczbę w linijce i
    porównać ja z Y ( Y ma jedna wartość i jest równe np.
    Y=1.717E+08), jeśli liczba ta jest większa od Y to skrypt powinien
    wprowadzić zmianę w linijce o tym samym numerze w pliku numer dwa -
    zmiana to wstawienie ** na początku linii
    Czyli tłumacząc na bardziej polskawe - tak jak po 20 minutah i piwie to zrozumiałem:

    WEJŚCIE:
    - 2 pliki tekstowe z numerowanymi wierszami (pierwszy 8 kolumn rozdzielanych spacjami, drugi 9 kolumn rozdzielanych przecinkami)
    - parametr X=..... (liczby rozdzielane przecinkami podawane jako ?!? parametry wiersza poleceń, plik o zadanym URL czy jakieś inne cudo?)
    - parametr Y=..... (pojedyncza wartość liczbowa w zapisie wykładniczym - j.w. - skąd program ma to brać?)

    OPERACJE:
    1 - jeśli numer przetwarzanego wiersza w pierwszym pliku nie znajduje się na liście wartości X idź do test 2, inaczej nie rób nic...
    2 - jeśli wartość ostatniej kolumny z pliku pierwszego jest większa od Y to poprzedź linię '** ', inaczej nie rób nic...

    WYJŚCIE:
    - plik tekstowy ze zmienionymi niektórymi liniami... a może nie plik ale po prostu wydrukowanie na ekran i wtedy można to kierować gdzie się chce - plik, pipe, tcp/ip, cokolwiek...

    A tłumacząc to na łopatologię stosowaną... w zmiennej X podajesz numery wierszy które nie mają być sprawdzane tylko od razu zostawione jak są a cała reszta ma być sprawdzana pod kątem wartości ostatniej kolumny (porównanej ze 'stałą' Y).

    Mam rację?!
    Nie rozumiem jeszcze tylko jakim cudem zmieniłeś wiersze 2 i 5 w podanym przykładzie skoro Y=1.717E+08 jest większe od 13xx - jeśli rozjaśnisz ten aspekt i uściślisz to co powyżej to mogę się pobawić... W sumie to jakieś 5-10 minut roboty...

  3. #3

    Unhappy

    ok no wiec to ma wygldac tak :
    WEJŚCIE:
    - 2 pliki tekstowe z numerowanymi wierszami (pierwszy 8 kolumn rozdzielanych spacjami, drugi 9 kolumn rozdzielanych przecinkami)
    - parametr X=..... (liczby podawane wpisywane na poczatku programu, np. z pliku, ja zroblem to tak :
    #wprowadzam zmienne X

    #print 'zaladowalem plik z numerami wezlow';
    open(wezly, 'wezly.txt') || die "brak pliku z wezlami";

    @wezly = <wezly>;
    )

    - parametr Y=..... (podaje ja z klawiatury:
    #wprowadzam druga zeminna Y

    print 'podaj wartosc parametru misessa:';
    $misess =<STDIN>;
    )

    OPERACJE:
    1 - jeśli numer przetwarzanego wiersza w pierwszym pliku nie znajduje się na liście wartości X idź do test 2, inaczej nie rób nic...
    2 - jeśli wartość ostatniej kolumny z pliku pierwszego jest większa od Y to poprzedź ta sama linię w drugim pliku '**' , inaczej nie rób nic...

    WYJŚCIE:
    - plik tekstowy np. OUT.TXT o formacie pliku drugiego (dowolna ilosc wierszy, 8 kolumn) tylko w liniach nie spelniajacych warunkow na paczatku wstawia sie **

    A tłumacząc to na łopatologię stosowaną... w zmiennej X podajesz numery wierszy które nie mają być sprawdzane tylko od razu zostawione jak są a cała reszta ma być sprawdzana pod kątem wartości ostatniej kolumny
    porównanej ze 'stałą' Y).
    zmienna X to sa wyjatki , czyli linie o tych numerach maja nie byc sprawdzane


    Nie rozumiem jeszcze tylko jakim cudem zmieniłeś wiersze 2 i 5 w podanym przykładzie skoro Y=1.717E+08 jest większe od 13xx - jeśli rozjaśnisz ten aspekt i uściślisz to co powyżej to mogę się pobawić... W sumie to jakieś 5-10 minut roboty...
    hmm, no wiec tu chodzi o to ze Y jest wieksze od liczby w 9 kolumnie pierwszego pliku, nie drugiego, drugi plik to poprostu dane do obrobienia , a warunki X i Y sa sprawdzane na 1 pliku i jesli nie sa one spelnione to wtedy 2plik dostaje w odpowiednim wierszu na poczatku '**'

    Jesli umiesz to zrobic albo ktokolwiek umie, to barzo by mi to pomoglo , ja juz kombinuje z tydzien z tym i nie dziala
    Ostatnio edytowane przez pukas : 07-04-2006 - 15:02

  4. #4
    Zarejestrowany
    Jun 2006
    Skąd
    rand(.eu)
    Postów
    8,748

    Domyślnie Gotowe

    No i jak mowilem... dokladnie 11 minut zajelo - uprzedzam jednak, sprawdzane jedynie na podanym wyzej przykladzie...

    Usage: wezly.pl <in-test.txt> <in-modify.txt> <wezly-skip.txt> [Y]

    wezly.pl:
    Kod:
    #!/usr/bin/perl -Tw
    use strict;
    use vars qw/%test %modify $Y/;
    
    # usage
    if ($#ARGV < 2) {
        print "Usage:\n\t wezly.pl <in-tested.txt> <in-changed.txt> <nodes-skip.txt>\n";
        exit 0;
    }
    
    # load data
    if (open (FH, $ARGV[0])) {
        while (<FH>) {
    	chomp;
    	next if (!/^\d/);
    	my @tmp = split(/\s+/);
    	$test{$tmp[0]} = $tmp[$#tmp];
        }
        close (FH);
    } else {
        die "Can't open file $ARGV[0]: $!\n";
    }
    
    if (open (FH, $ARGV[1])) {
        while (<FH>) {
    	chomp;
    	next if (!/^\d/);
    	m/^(\d+)/;
    	$modify{$1} = $_;
        }
        close (FH);
    } else {
        die "Can't open file $ARGV[1]: $!\n";
    }
    
    if (open (FH, $ARGV[2])) {
        while (<FH>) {
    	chomp;
    	next if (!/^\d$/);
    	delete $test{$_};
        }
        close (FH);
    } else {
        die "Can't open file $ARGV[2]: $!\n";
    }
    
    # get Y
    print "Y = ";
    chomp(my $Y=<STDIN>);
    
    # do testing on what has left after loading nodes list
    foreach my $node (keys %test) {
        $test{$node} > $Y ? $modify{$node} = '** ' . $modify{$node} : undef;
    }
    
    # print results to STDOUT (yup! be flexible and redy to be redirected!)
    open (FH, '>wezly-out.txt') || die "Can't open output file: $!\n";
    foreach my $node (sort keys %modify) {
        print FH "$modify{$node}\n";
    }
    close (FH);
    Dane testowe copy'n'paste z tego co podales w opisie. Plik wezly-skip.txt zawiera numery wezlow do pominiecia w testach, jeden numer w kazdej linii (w testach mialem 1, 2, 4 i 6).

    Wynik zapisany do wezly-out.txt to:

    Kod:
    1, 93, 297, 20, 1, 1424, 1628, 1351, 1332
    2, 297, 298, 21, 20, 1628, 1629, 1352, 1351
    ** 3, 298, 299, 22, 21, 1629, 1630, 1353, 1352
    4, 299, 300, 23, 22, 1630, 1631, 1354, 1353
    ** 5, 300, 301, 24, 23, 1631, 1632, 1355, 1354
    6, 301, 302, 25, 24, 1632, 1633, 1356, 1355
    Czyli ok, bo zgodnie z wartosciami wiersz 2 tez powinien byc zmieniony :-)
    Mam nadzieje ze sie przyda :-)

  5. #5

    Smile Dzieki wielkie :-D

    czesc
    widze ze troche w tym siedzisz , jak dla mnie to dosc skomplikowanie wyglda , troche sie zaglebiam ten koda ale niewiele rozumiem
    nie wiem tylko dlaczego u mnie nie dziala to (pisze pod win xp ;perl 5.6.1)
    mozesz mi powiedziec jeszcze tylko jak to zmodyfikowac zeby dzialalo pod xp?
    dostaje wiadomosc : too late for "-T" option at c:\perl\wezly.pl line 1.
    Ostatnio edytowane przez pukas : 07-04-2006 - 19:42

  6. #6
    Zarejestrowany
    Jun 2006
    Skąd
    rand(.eu)
    Postów
    8,748

    Domyślnie

    Po prostu usuń z pierwszej linijki '-T' czyli zostaw 'perl -w' zamiast '-Tw' :-)
    Całe '-T' to nic więcej jak Taint Checking... czsami się przydaje ale skoro Windzie to nie pasuje to po prostu usuń... i tak jest warnings włączone więc czasami jak podłożysz źle sformatowany plik wejściowy to dostaniesz masę informacji typu "Use of uninitialized value at ..." itd. Mówiąc krótko - normalka :-)

    Jeszcze próbowałem właśnie czy nie można poprawić nieco skryptu aby działał w pełni strumieniowo... tzn:

    Kod:
    cat Y.txt test.txt modify.txt exclude.txt |wezly.pl > out.txt
    bo mógłbyś wtedy to puścić jak chcesz i gdzie chcesz :-) ale albo jestem zmęczony albo staram się przekombinować pobawięc się później z ciekawości...

Zasady Postowania

  • Nie możesz zakładać nowych tematów
  • Nie możesz pisać wiadomości
  • Nie możesz dodawać załączników
  • Nie możesz edytować swoich postów
  •  
Subskrybuj