PragtTextUtil PTU freeware
© 2011 Hein Pragt
Ik heb als software ontwikkelaar al jaren een directory met allemaal kleine utility programma's
waaronder veel Unix utilities die ik op elk systeem waar ik moet werken neerzet. Dit ging jarenlang
goed tot ik overging op Windows 7 en al deze command line tools niet meer werkten. Ik stond voor de
keuze om al deze programma's opnieuw te compileren voor Windows 7 of eindelijk eens al de functies
van deze kleine utility programma's samen te voegen in één portable Win32 programma. Ik koos voor
het ontwikkelen van het programma PragtTextUtil (PTU) dat ik hierbij als freeware programma aanbied.
Wat voor programma is PragtTextUtil
PragtTextUtil is geen editor hoewel de basis functies om tekst te kunnen bewerken wel aanwezig zijn in het
programma. Het programma is bedoeld om bewerkingen uit te voeren op tekst zoals het omzetten naar hoofd of
kleine letters of het verwijderen van HTML tags en het omzetten naar nette paragrafen. Maar ook bewerkingen
als trim, uniq, sort en filtering zitten in dit programma en een complexe bewerking om een gesorteerd woord
frequentie overzicht te maken om bijvoorbeeld goede keywords voor een webpagina te kunnen bepalen. Ook kunt
u bijvoorbeeld uit een logbestand alle regels filteren die een bepaald woord bevatten of juist niet een
bepaald woord bevatten. Ook een leuke optie is zoek en vervang met de mogelijkheid om CTRL tekens te gebruiken
in de zoek maar ook de vervang tekst.
Als invoer kan het programma natuurlijk alle vormen van platte tekstbestanden lezen, maar ook bestanden
als hex/ascii dump, html pagina's, webpagina's via een HTTP verzoek (simpele wget) om de exacte response van
een internet server op te vangen. Maar ook kunt u de inhoud van uw directory in de tekstbewerker laden om
zo bijvoorbeeld een gesorteerde lijst van al uw muziek te maken. (Onder Windows is het nog steeds niet
mogelijk om de lijst uit de verkenner te knippen en plakken). Ook kunt u de uitvoer van een command line
opdracht rechtstreeks in de tekstbewerker inlezen.
Via de functie om een webpagina op te vragen kunt u de HTML van deze pagina in de tekstbewerker laden
waarna u eenvoudig alle HTML tags en scripting kunt verwijderen en daarna de kale tekst om kunt zetten in
nette paragrafen die u in uw favoriete tekstverwerker verder kunt bewerken. Hiermee kunt u bijvoorbeeld
ook teksten ophalen van sites die het knippen en kopiëren van de tekst proberen te blokkeren.
Voorbeeld van zoek en vervang met control characters.
In het volgende voorbeeld laat ik zien hoe u door middel van een paar eenvoudige handelingen een stukje
tekst met een aantal regels kunt omzetten naar een html ordered list en hoe u deze dan kunt sorteren en
eenvoudig kunt plakken in uw webpagina.
We beginnen met een paar regels tekst die we ergens vandaan geknipt hebben.
Nu vervangt u de ^m^j (einde regel tekens) door </li>^m^j<li>
Het resultaat is dat er rond de regels netjes open en sluittags staan.
* Alleen even de eerste en de laatste regel aanpassen.
Hierna geeft u de opdracht om de tekst te sorteren.
U heeft een keurige html ordered list die u zo in uw webpagina kunt plakken.
Voorbeeld van woordstatistieken.
Voor het bepalen van de juiste keywords voor uw Internet pagina is het belangrijk om te weten hoe
vaak een woord voorkomt op de pagina. Met een paar eenvoudige handelingen kunt u met dit programma een
gesorteerde lijst maken van alle woorden en de freqentie waarmee ze voorkomen in de tekst.
Eerste plakken we de html code van de pagina in PragtTextUtil.
Hierna verwijderd u eerst alle html code uit de pagina.
Hierna kist u voor de optie woordstatistieken.
Nu heeft u een overzicht van alle woorden met de frequentie binnen de tekst van de pagina.
Voorbeeld van het kopieren van tekst van een beveiligde internetpagina.
Het is uitermate vervelend wanneer u na lang zoeken een mooi stukje tekst voor uw werkstuk gevonden
heeft of wanneer u een stuk tekst van een Internetpagina wilt citeren in uw scriptie en de site heeft
het knippen en plakken geblokkeerd. Deze beveiliging is met het programma PragtTextUtil eenvoudig te
omzeilen en u kunt de tekst zelfs omzetten in "nette" paragrafen.
Ga naar de browser optie om de bron van de Internetpagina te bekijken.
Knip in dit vernster de tekst met alle HTML opmaak erbij uit het venster.
Plak dit in PragtTextUtil en kies voor de optie om de HTML code te verwijderen.
Kies daarna de optie om "nette" paragrafen te maken.
U heeft de tekst van de Internetpagina als "nette" paragrafen, die u zo in uw stuk kunt plakken.
Het maken van een gesorteerde lijst van al uw MP3 bestanden.
Soms wilt u een lijst maken van een inhoudsopgave van uw harde schijf om bijvoorbeeld een lijst van
al uw MP3 bestanden naar een kennis te sturen in de vorm van een tekstbestand. Helaas kunt u vanuit de
MS-Windows verkenner niet knippen en plakken. Met behulp van PragtTextUtil is dit zeer eenvoudig.
Open PragtTextUtil en kies te optie om een directory listing te maken em selecteer de goede directory.
Wanneer de lijst ingelezen is kunt u deze eenvoudig sorteren.
Hierna heeft u een keurig gesorteerde lijst van al uw MP3 bestanden die u zo kunt knippen en plakken.
Nieuw in versie 1.02
1. De trim functie verbeterd zodat nu alle "whitespace" inclusief tabs e.d. aan het begin en einde van een regel verwijderd zal worden.
2. Een format HTML functie toegevoegd die "slordige" html of html zonder regeleindes, netjes van regeleindes voorziet (achter de eind tags van
block elementen) en alle begin tags van block elementen netjes op een nieuwe regel laat beginnen.
Nieuw in versie 1.03
1. Het programma kan nu ook unicode (wide character) bestanden inlezen en omzetten naar het windows systeem font.
2. Het programma kan ook alleen de eerste 50 regels of de laatste 50 regels van een bestand inlezen, dit is
vergelijkbaar met head en tail onder Unix. Dit kan handig zijn om een bestand even te onderzoeken of de laatste regels in een
logbestand even te bekijken zonder gelijk het hele bestand in te lezen.
3. Het programma kan nu ook UTF8 gecodeerde bestanden inlezen en omzetten naar iso-8859-1 of UTF8 omzetten naar platte ascii
waarbij alle tekens met diacrieten omgezet worden naar hetzelfde ascii teken zonder diacriet.
4. Het programma kan bestanden met Unix regeleindes (alleen newlines) omzetten naar Windows/Dos formaat (newline & return).
5. Het programma geeft nu een correcte foutmelding als het tekstbestand te groot is voor het internet buffer.
Nieuw in versie 1.04
1. Format HTML zal nu ook alle HTML tags naar lowercase omzetten.
2. De functie zoeken in bestanden (grep met reguliere expressies) is nu toegevoegd, waarbij ook een hele directory tree doorzocht kan worden.
3. De functie om twee bestanden te vergelijken en de verschillen te tonen (diff) is toegevoegd.
Disclaimer
Although utmost care has been taken to ensure the correctness of the software, the software is provided "as is" without any warranty of any kind.
The author, of this software accepts no responsibility for damages resulting from the use of this product and makes no warranty or representation,
either express or implied, including but not limited to, any implied warranty of merchantability or fitness for a particular purpose.
Hoewel ik het programma zelf ook gebruik en regelmatig verbeter sta ik open voor suggesties voor verbetering
en eventueel nieuwe functies. Het programma is geschreven in Win32 C door middel van Microsoft Visual Studio,
het is klein en compact en volledig portable en bestaat slechts uit één executable file. Wanneer u opmerkingen
heeft over dit programma kunt u mailen met email HeinPragt
Download
Lees de disclaimer voordat u dit programma gaat gebruiken! Please read the disclaimer before using this program!
Klik hier om het programma te downloaden. (Versie 1.04 Jul 2011)
Vorige versies
Klik hier om het programma te downloaden. (Versie 1.03 Jul 2011)
Klik hier om het programma te downloaden. (Versie 1.02 Jun 2011)
Menu in versie 1.04
File
New
Open as text
Open as Unicode text
Open as text (read first 50 lines)
Open as text (read last 50 lines)
Open and convert to hex/ascii
Open from HTTP
Open and pipe command line
Save text
Save text As
Read directory listing (date/size/name)
Read directory listing (names)
Search trough files
Compare files
Exit
Edit
Undo
Select All
Copy to clipboard
Cut to clipboard
Paste from clipboard
Delete selection
Search text
Replace text
Goto line
|
Operations
ToUpper selection
ToLower selection
Smart ToLower to paragraphs
Whitespace to single space
Whitespace to single space (save linebreaks)
ToWordList (whitespace to inebreaks)
Count lines, words, characters
Words statistics (whole document)
Sort
Sort selection Asc
Sort selection Desc
Sort selection Asc (Ignore case)
Sort selection Desc (Ignore case)
Filter
Strip html (add linebreaks)
Format html
Trim leading and trailing spaces
Uniq the selection
Uniq the selection with count
Filter the selection (delete all except)
Remove in the selection (delete all that contain)
UTF-8 to iso-8859-1
UTF-8 to plain ascii (remove diacrites)
\n (Unix) to \n\r (Dos/Windows)
Help
About
|
Last update: 09-06-2011
|