Carerix datasource
Versie 1.1
Dit document beschrijft de mogelijkheden om de datasource bestanden van Carerix te kunnen koppelen/ophalen.
De datasource bestanden worden beschikbaar gesteld op onze FTP server en/of in een Amazon S3 bucket.
1. Verbinding testen met behulp van netcat (FTP server)
Besturingssysteem: Linux en MacOS
Getest op macOS 15.2
IP adres waarvandaan de netcat test wordt uitgevoerd dient op onze whitelist te staan
Explicit FTPS
% nc -vvv 21
Connection to port 21 [tcp/ftp] succeeded!
220-FileZilla Server 1.9.3
220 Please visit
2. FileZilla client GUI (FTP server)
Besturingssysteem: Linux, Windows en MacOS
Getest op macOS 15.2 met FileZilla client 3.68.1 Apple Silicon (arm64)
FTP gebruikersnaam
FTP wachtwoord
IP adres waarvandaan FileZilla client wordt gebruikt dient op onze whitelist te staan
In het geval dat er een uitgaande firewall wordt gebruikt; voor IP adres dienen TCP poorten 21 en 21000 tot en met 21010 toegestaan te zijn
3. WinScp client command line interface (FTP server)
Besturingssysteem: Windows
Getest op Windows 11 met WinScp 6.1.1
WinScp (Typical install)
FTP gebruikersnaam
FTP wachtwoord
IP adres waarvandaan WinScp wordt gebruikt dient op onze whitelist te staan
In het geval dat er een uitgaande firewall wordt gebruikt; voor IP adres dienen TCP poorten 21 en 21000 tot en met 21010 toegestaan te zijn
Open command prompt (cmd.exe)
"C:\Program Files (x86)\WinSCP\"
winscp> open ftpes://
Connecting to ...
TLS connection established. Waiting for welcome message...
Starting the session...
Session started.
Active session: [1]
winscp> ls crmatch*
D--------- 0 0 ..
---------- 0 23245 Aug 20 1:22:28 2023 Cragency.csv
winscp> get crcompany.csv c:\temp\
crcompany.csv | 36260 KB | 2131.9 KB/s | binary | 100%
winscp> exit
als commando in een batch file
C:\Program Files (x86)\WinSCP\ /command ^
"ftpes://" ^
"get *.csv c:\temp\" ^
4. Cyberduck GUI (S3 bucket)
Besturingssysteem: Linux, Windows en macOS
Getest op macOS 15.2 met Cyberduck client 9.1.0
AWS S3 bucket naam: datasource-klantnaam
AWS access key id
AWS secret access key
AWS region: eu-central-1 (Frankfurt)
5. PowerBI desktop Python connector (S3 bucket)
Haalt de data van één specifiek S3 bucket bestand op.
Besturingssysteem: Windows
Getest met PowerBI Desktop 2.120.731.0 en Python 3.11.4
PowerBI Desktop
Python 3, pip en enkele python modules
AWS S3 bucket naam: datasource-klantnaam
AWS access key id
AWS secret access key
AWS region: eu-central-1 (Frankfurt)
Open command prompt (cmd.exe)
# ga naar de folder waar python is geïnstalleerd
cd C:\Users\xxxxxx\AppData\Local\Programs\Python\Python311
# installeer python package manager pip
curl | python
curl | python
# installeer de benodigde python modules
Scripts\pip.exe install boto3 matplotlib pandas
Open PowerBI Desktop > Home > Get data > more > Python
Crcompany.csv voorbeeld
import boto3, os, io
import pandas as pd
my_key= 'xxxxxx'
my_secret= 'xxxxxx'
my_bucket_name = 'datasource-xxxxxx'
my_file = 'Crcompany.csv'
session = boto3.Session(aws_access_key_id=my_key,aws_secret_access_key=my_secret)
s3 = session.resource('s3')
bucket = s3.Bucket(my_bucket_name)
bucket.download_file(my_file, my_file)
crcompany = pd.read_csv(my_file, delimiter='\t')
6. AWS command line interface (S3 bucket)
Besturingssysteem: Linux, Windows en macOS
Getest op macOS 15.2 met AWS CLI 2.22.17
AWS S3 bucket naam: datasource-klantnaam
AWS access key id
AWS secret access key
AWS region: eu-central-1 (Frankfurt)
# macOS voorbeeld
$ which aws
$ aws --version
aws-cli/2.2.23 Python/3.8.8 Darwin/22.6.0 exe/x86_64 prompt/of
# maak een default profiel aan
$ aws configure
AWS Access Key ID [None]: xxxxxx
AWS Secret Access Key [None]: xxxxxx
Default region name [None]: eu-central-1
Default output format [None]: json
$ aws s3 ls s3://datasource-klantnaam/
2023-08-19 03:32:06 8456 Cragency.csv
2023-08-19 03:32:06 4579 Crarticle.csv
2023-08-19 03:32:06 153351138 Crattachment.csv
2023-08-19 03:32:08 509534996 Crattributechange.csv
# synchroniseer alle csv bestanden naar de lokale folder /var/tmp
# download alleen bestanden indien het bestand gewijzigd is; dit voorkomt onnodig downloaden van bestanden
$ aws s3 sync s3://datasource-klantnaam/ /var/tmp --include "*.csv"