PragtTextUtil PTU freeware

© 2011 Hein Pragt

PragtTextUtil freeware text utility programIk heb als software ontwikkelaar al jaren een directory met allemaal kleine utility programma's waaronder veel Unix utilities die ik op elk systeem waar ik moet werken neerzet. Dit ging jarenlang goed tot ik overging op Windows 7 en al deze command line tools niet meer werkten. Ik stond voor de keuze om al deze programma's opnieuw te compileren voor Windows 7 of eindelijk eens al de functies van deze kleine utility programma's samen te voegen in één portable Win32 programma. Ik koos voor het ontwikkelen van het programma PragtTextUtil (PTU) dat ik hierbij als freeware programma aanbied.


Wat voor programma is PragtTextUtil

PragtTextUtil is geen editor hoewel de basis functies om tekst te kunnen bewerken wel aanwezig zijn in het programma. Het programma is bedoeld om bewerkingen uit te voeren op tekst zoals het omzetten naar hoofd of kleine letters of het verwijderen van HTML tags en het omzetten naar nette paragrafen. Maar ook bewerkingen als trim, uniq, sort en filtering zitten in dit programma en een complexe bewerking om een gesorteerd woord frequentie overzicht te maken om bijvoorbeeld goede keywords voor een webpagina te kunnen bepalen. Ook kunt u bijvoorbeeld uit een logbestand alle regels filteren die een bepaald woord bevatten of juist niet een bepaald woord bevatten. Ook een leuke optie is zoek en vervang met de mogelijkheid om CTRL tekens te gebruiken in de zoek maar ook de vervang tekst.

Als invoer kan het programma natuurlijk alle vormen van platte tekstbestanden lezen, maar ook bestanden als hex/ascii dump, html pagina's, webpagina's via een HTTP verzoek (simpele wget) om de exacte response van een internet server op te vangen. Maar ook kunt u de inhoud van uw directory in de tekstbewerker laden om zo bijvoorbeeld een gesorteerde lijst van al uw muziek te maken. (Onder Windows is het nog steeds niet mogelijk om de lijst uit de verkenner te knippen en plakken). Ook kunt u de uitvoer van een command line opdracht rechtstreeks in de tekstbewerker inlezen.

Via de functie om een webpagina op te vragen kunt u de HTML van deze pagina in de tekstbewerker laden waarna u eenvoudig alle HTML tags en scripting kunt verwijderen en daarna de kale tekst om kunt zetten in nette paragrafen die u in uw favoriete tekstverwerker verder kunt bewerken. Hiermee kunt u bijvoorbeeld ook teksten ophalen van sites die het knippen en kopiëren van de tekst proberen te blokkeren.


Voorbeeld van zoek en vervang met control characters.

In het volgende voorbeeld laat ik zien hoe u door middel van een paar eenvoudige handelingen een stukje tekst met een aantal regels kunt omzetten naar een html ordered list en hoe u deze dan kunt sorteren en eenvoudig kunt plakken in uw webpagina.

We beginnen met een paar regels tekst die we ergens vandaan geknipt hebben.

vervangen einde regel door html tags

Nu vervangt u de ^m^j (einde regel tekens) door </li>^m^j<li>

vervangen einde regel door html tags

Het resultaat is dat er rond de regels netjes open en sluittags staan.

* Alleen even de eerste en de laatste regel aanpassen.

vervangen einde regel door html tags

Hierna geeft u de opdracht om de tekst te sorteren.

vervangen einde regel door html tags

U heeft een keurige html ordered list die u zo in uw webpagina kunt plakken.

vervangen einde regel door html tags

Voorbeeld van woordstatistieken.

Voor het bepalen van de juiste keywords voor uw Internet pagina is het belangrijk om te weten hoe vaak een woord voorkomt op de pagina. Met een paar eenvoudige handelingen kunt u met dit programma een gesorteerde lijst maken van alle woorden en de freqentie waarmee ze voorkomen in de tekst.

Eerste plakken we de html code van de pagina in PragtTextUtil.

woord statistieken

Hierna verwijderd u eerst alle html code uit de pagina.

woord statistieken

Hierna kist u voor de optie woordstatistieken.

woord statistieken

Nu heeft u een overzicht van alle woorden met de frequentie binnen de tekst van de pagina.

woord statistieken

Voorbeeld van het kopieren van tekst van een beveiligde internetpagina.

Het is uitermate vervelend wanneer u na lang zoeken een mooi stukje tekst voor uw werkstuk gevonden heeft of wanneer u een stuk tekst van een Internetpagina wilt citeren in uw scriptie en de site heeft het knippen en plakken geblokkeerd. Deze beveiliging is met het programma PragtTextUtil eenvoudig te omzeilen en u kunt de tekst zelfs omzetten in "nette" paragrafen.

Ga naar de browser optie om de bron van de Internetpagina te bekijken.

tekst van een internetpagina kopieren

Knip in dit vernster de tekst met alle HTML opmaak erbij uit het venster.

tekst van een internetpagina kopieren

Plak dit in PragtTextUtil en kies voor de optie om de HTML code te verwijderen.

tekst van een internetpagina kopieren

Kies daarna de optie om "nette" paragrafen te maken.

tekst van een internetpagina kopieren

U heeft de tekst van de Internetpagina als "nette" paragrafen, die u zo in uw stuk kunt plakken.

tekst van een internetpagina kopieren

Het maken van een gesorteerde lijst van al uw MP3 bestanden.

Soms wilt u een lijst maken van een inhoudsopgave van uw harde schijf om bijvoorbeeld een lijst van al uw MP3 bestanden naar een kennis te sturen in de vorm van een tekstbestand. Helaas kunt u vanuit de MS-Windows verkenner niet knippen en plakken. Met behulp van PragtTextUtil is dit zeer eenvoudig.

Open PragtTextUtil en kies te optie om een directory listing te maken em selecteer de goede directory.

maken van een lijst van al uw MP3 bestanden

Wanneer de lijst ingelezen is kunt u deze eenvoudig sorteren.

maken van een lijst van al uw MP3 bestanden

Hierna heeft u een keurig gesorteerde lijst van al uw MP3 bestanden die u zo kunt knippen en plakken.

maken van een lijst van al uw MP3 bestanden

Nieuw in versie 1.02

1. De trim functie verbeterd zodat nu alle "whitespace" inclusief tabs e.d. aan het begin en einde van een regel verwijderd zal worden.

2. Een format HTML functie toegevoegd die "slordige" html of html zonder regeleindes, netjes van regeleindes voorziet (achter de eind tags van block elementen) en alle begin tags van block elementen netjes op een nieuwe regel laat beginnen.



Nieuw in versie 1.03

1. Het programma kan nu ook unicode (wide character) bestanden inlezen en omzetten naar het windows systeem font.

2. Het programma kan ook alleen de eerste 50 regels of de laatste 50 regels van een bestand inlezen, dit is vergelijkbaar met head en tail onder Unix. Dit kan handig zijn om een bestand even te onderzoeken of de laatste regels in een logbestand even te bekijken zonder gelijk het hele bestand in te lezen.

3. Het programma kan nu ook UTF8 gecodeerde bestanden inlezen en omzetten naar iso-8859-1 of UTF8 omzetten naar platte ascii waarbij alle tekens met diacrieten omgezet worden naar hetzelfde ascii teken zonder diacriet.

4. Het programma kan bestanden met Unix regeleindes (alleen newlines) omzetten naar Windows/Dos formaat (newline & return).

5. Het programma geeft nu een correcte foutmelding als het tekstbestand te groot is voor het internet buffer.



Nieuw in versie 1.04

1. Format HTML zal nu ook alle HTML tags naar lowercase omzetten.

2. De functie zoeken in bestanden (grep met reguliere expressies) is nu toegevoegd, waarbij ook een hele directory tree doorzocht kan worden.

3. De functie om twee bestanden te vergelijken en de verschillen te tonen (diff) is toegevoegd.



Disclaimer

Although utmost care has been taken to ensure the correctness of the software, the software is provided "as is" without any warranty of any kind. The author, of this software accepts no responsibility for damages resulting from the use of this product and makes no warranty or representation, either express or implied, including but not limited to, any implied warranty of merchantability or fitness for a particular purpose.

Hoewel ik het programma zelf ook gebruik en regelmatig verbeter sta ik open voor suggesties voor verbetering en eventueel nieuwe functies. Het programma is geschreven in Win32 C door middel van Microsoft Visual Studio, het is klein en compact en volledig portable en bestaat slechts uit één executable file. Wanneer u opmerkingen heeft over dit programma kunt u mailen met email HeinPragt


Download

Lees de disclaimer voordat u dit programma gaat gebruiken!
Please read the disclaimer before using this program!

Klik hier om het programma te downloaden. (Versie 1.07 2018)

Vorige versies

Klik hier om het programma te downloaden. (Versie 1.04 Jul 2011)

Klik hier om het programma te downloaden. (Versie 1.03 Jul 2011)

Klik hier om het programma te downloaden. (Versie 1.02 Jun 2011)


Menu in versie 1.07

File
   New
   Open as text
   Open as Unicode text
   Open as text (read first 50 lines)
   Open as text (read last 50 lines)
   Open and convert to hex/ascii
   Open from HTTP
   Open and pipe command line
   Save text
   Save text As
   Read directory listing (date/size/name)
   Read directory listing (names)
   Search trough files
   Compare files
   Exit

Edit
   Undo
   Select All
   Copy to clipboard
   Cut to clipboard
   Paste from clipboard
   Delete selection
   Search text
   Replace text
   Goto line

Operations
   ToUpper selection
   ToLower selection
   Smart ToLower to paragraphs
   Whitespace to single space
   Whitespace to single space (save linebreaks)
   ToWordList (whitespace to inebreaks)
   Count lines, words, characters
   Words statistics (whole document)

Sort
   Sort selection Asc
   Sort selection Desc
   Sort selection Asc (Ignore case)
   Sort selection Desc (Ignore case)

Filter
   Strip html (add linebreaks)
   Format html
   Trim leading and trailing spaces
   Uniq the selection
   Uniq the selection with count
   Filter the selection (delete all except)
   Remove in the selection (delete all that contain)
   UTF-8 to iso-8859-1
   UTF-8 to plain ascii (remove diacrites)
   \n (Unix) to \n\r (Dos/Windows)

Help
   About
   


Last update: 08-01-2018
 Binnen dit thema



 Meer thema's


 Lees hier de privacyverklaring van deze site.

Disclaimer.

Hoewel de heer Hein Pragt de informatie beschikbaar op deze pagina met grote zorg samenstelt, sluit de heer Pragt alle aansprakelijkheid uit met betrekking tot de informatie die, in welke vorm dan ook, via zijn site wordt aangeboden. Het opnemen van een afbeelding of verwijzing is uitsluitend bedoeld als een mogelijke bron van informatie voor de bezoeker en mag op generlei wijze als instemming, goedkeuring of afkeuring worden uitgelegd, noch kunnen daaraan rechten worden ontleend. Op de artikelen van de heer Pragt op deze Internetsite rust auteursrecht. Overname van informatie (tekst en afbeeldingen) is uitsluitend toegestaan na voorafgaande schriftelijke toestemming van de rechthebbende. Voor vragen over copyright en het gebruik van de informatie op deze site kunt u contact opnemen met: (email: mail@heinpragt.com). Dit is mijn