Thanks, David. You will be pleased to know that I am able to perform the operations above with Queryverse.jl and it works fine ; )
It may be a bit off topic, but if anyone is interested, I can filter the exact same data set in Queryverse like this:
using Queryverse
acs = load("psam_pusa.csv", type_detect_rows = 2000)
This yields the following:
4691835x286 CSV file
RT โ SERIALNO โ DIVISION โ SPORDER โ PUMA โ REGION โ ST โ ADJINC โ PWGTP โ AGEP โ CIT โ CITWP โ COW โ DDRS โ DEAR โ DEYE โ DOUT โ DPHY โ DRAT โ DRATX โ DREM โ ENG โ FER โ GCL โ GCM โ GCR โ HINS1 โ HINS2 โ HINS3 โ HINS4 โ HINS5
โโโโผโโโโโโโโโโโโโโโโผโโโโโโโโโโโผโโโโโโโโโโผโโโโโโโผโโโโโโโโโผโโโโโผโโโโโโโโโโผโโโโโโโโผโโโโโโโผโโโโโโผโโโโโโโโผโโโโโโผโโโโโโโผโโโโโโโผโโโโโโโผโโโโโโโผโโโโโโโผโโโโโโโผโโโโโโโโผโโโโโโโผโโโโโโผโโโโโโผโโโโโโผโโโโโโผโโโโโโผโโโโโโโโผโโโโโโโโผโโโโโโโโผโโโโโโโโผโโโโโโ
P โ 2013000000084 โ 6 โ 1 โ 2600 โ 3 โ 1 โ 1061971 โ 13 โ 19 โ 1 โ #NA โ #NA โ 2 โ 2 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ 2 โ #NA โ #NA โ #NA โ 1 โ 2 โ 2 โ 2 โ 2
P โ 2013000000154 โ 6 โ 1 โ 2500 โ 3 โ 1 โ 1061971 โ 11 โ 55 โ 1 โ #NA โ 1 โ 2 โ 2 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 1 โ 2 โ 2 โ 2 โ 2
P โ 2013000000154 โ 6 โ 2 โ 2500 โ 3 โ 1 โ 1061971 โ 13 โ 56 โ 1 โ #NA โ 6 โ 2 โ 2 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 1 โ 2 โ 2 โ 2 โ 2
P โ 2013000000154 โ 6 โ 3 โ 2500 โ 3 โ 1 โ 1061971 โ 30 โ 21 โ 1 โ #NA โ #NA โ 2 โ 2 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ #NA โ #NA โ #NA โ 1 โ 2 โ 2 โ 2 โ 2
P โ 2013000000154 โ 6 โ 4 โ 2500 โ 3 โ 1 โ 1061971 โ 15 โ 21 โ 1 โ #NA โ #NA โ 1 โ 2 โ 2 โ 1 โ 1 โ #NA โ #NA โ 2 โ #NA โ 2 โ #NA โ #NA โ #NA โ 1 โ 2 โ 2 โ 2 โ 2
P โ 2013000000156 โ 6 โ 1 โ 1700 โ 3 โ 1 โ 1061971 โ 93 โ 63 โ 1 โ #NA โ 3 โ 2 โ 2 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 1 โ 2 โ 2 โ 2 โ 2
P โ 2013000000160 โ 6 โ 1 โ 2200 โ 3 โ 1 โ 1061971 โ 5 โ 61 โ 1 โ #NA โ #NA โ 2 โ 2 โ 2 โ 1 โ 1 โ #NA โ #NA โ 2 โ #NA โ #NA โ 1 โ 5 โ 1 โ 2 โ 2 โ 1 โ 2 โ 2
P โ 2013000000160 โ 6 โ 2 โ 2200 โ 3 โ 1 โ 1061971 โ 11 โ 20 โ 1 โ #NA โ 1 โ 2 โ 2 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ #NA โ #NA โ #NA โ 2 โ 2 โ 2 โ 2 โ 2
P โ 2013000000160 โ 6 โ 3 โ 2200 โ 3 โ 1 โ 1061971 โ 2 โ 12 โ 1 โ #NA โ #NA โ 2 โ 2 โ 2 โ #NA โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ #NA โ #NA โ #NA โ 2 โ 2 โ 2 โ 1 โ 2
P โ 2013000000231 โ 6 โ 1 โ 2400 โ 3 โ 1 โ 1061971 โ 10 โ 78 โ 1 โ #NA โ 2 โ 2 โ 1 โ 2 โ 2 โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 2 โ #NA โ #NA โ 2 โ 1 โ 1 โ 1 โ 2
... with 4691825 more rows, and 255 more columns: HINS6, HINS7, INTP, JWMNP, JWRIP, JWTR, LANX, MAR, MARHD, MARHM, MARHT, MARHW, MARHYP, MIG, MIL, MLPA, MLPB, MLPCD, MLPE, MLPFG, MLPH, MLPI, MLPJ, MLPK, NWAB, NWAV, NWLA, NWLK, NWRE, OIP, PAP, RELP, RETP, SCH, SCHG, SCHL, SEMP, SEX, SSIP, SSP, WAGP, WKHP, WKL, WKW, WRK, YOEP, ANC, ANC1P, ANC2P, DECADE, DIS, DRIVESP, ESP, ESR, FOD1P, FOD2P, HICOV, HISP, INDP, JWAP, JWDP, LANP, MIGPUMA, MIGSP, MSP, NAICSP, NATIVITY, NOP, OC, OCCP, PAOC, PERNP, PINCP, POBP, POVPIP, POWPUMA, POWSP, PRIVCOV, PUBCOV, QTRBIR, RAC1P, RAC2P, RAC3P, RACAIAN, RACASN, RACBLK, RACNH, RACNUM, RACPI, RACSOR, RACWHT, RC, SCIENGP, SCIENGRLP, SFN, SFR, SOCP, VPS, WAOB, FAGEP, FANCP, FCITP, FCITWP, FCOWP, FDDRSP, FDEARP, FDEYEP, FDISP, FDOUTP, FDPHYP, FDRATP, FDRATXP, FDREMP, FENGP, FESRP, FFERP, FFODP, FGCLP, FGCMP, FGCRP, FHICOVP, FHINS1P, FHINS2P, FHINS3C, FHINS3P, FHINS4C, FHINS4P, FHINS5C, FHINS5P, FHINS6P, FHINS7P, FHISP, FINDP, FINTP, FJWDP, FJWMNP, FJWRIP, FJWTRP, FLANP, FLANXP, FMARP, FMARHDP, FMARHMP, FMARHTP, FMARHWP, FMARHYP, FMIGP, FMIGSP, FMILPP, FMILSP, FOCCP, FOIP, FPAP, FPERNP, FPINCP, FPOBP, FPOWSP, FPRIVCOVP, FPUBCOVP, FRACP, FRELP, FRETP, FSCHGP, FSCHLP, FSCHP, FSEMP, FSEXP, FSSIP, FSSP, FWAGP, FWKHP, FWKLP, FWKWP, FWRKP, FYOEP, PWGTP1, PWGTP2, PWGTP3, PWGTP4, PWGTP5, PWGTP6, PWGTP7, PWGTP8, PWGTP9, PWGTP10, PWGTP11, PWGTP12, PWGTP13, PWGTP14, PWGTP15, PWGTP16, PWGTP17, PWGTP18, PWGTP19, PWGTP20, PWGTP21, PWGTP22, PWGTP23, PWGTP24, PWGTP25, PWGTP26, PWGTP27, PWGTP28, PWGTP29, PWGTP30, PWGTP31, PWGTP32, PWGTP33, PWGTP34, PWGTP35, PWGTP36, PWGTP37, PWGTP38, PWGTP39, PWGTP40, PWGTP41, PWGTP42, PWGTP43, PWGTP44, PWGTP45, PWGTP46, PWGTP47, PWGTP48, PWGTP49, PWGTP50, PWGTP51, PWGTP52, PWGTP53, PWGTP54, PWGTP55, PWGTP56, PWGTP57, PWGTP58, PWGTP59, PWGTP60, PWGTP61, PWGTP62, PWGTP63, PWGTP64, PWGTP65, PWGTP66, PWGTP67, PWGTP68, PWGTP69, PWGTP70, PWGTP71, PWGTP72, PWGTP73, PWGTP74, PWGTP75, PWGTP76, PWGTP77, PWGTP78, PWGTP79, PWGTP80
I can then filter it like this (note that Iโve added a filter criterion that doesnโt appear in the operation above):
acs |>
@filter(_.ESR == 1 || _.ESR == 2) |>
@filter(_.WKHP > 40) |>
DataFrame
Which results in the following output:
530509ร286 DataFrame. Omitted printing of 262 columns
โ Row โ RT โ SERIALNO โ DIVISION โ SPORDER โ PUMA โ REGION โ ST โ ADJINC โ PWGTP โ AGEP โ CIT โ CITWP โ COW โ DDRS โ DEAR โ DEYE โ DOUT โ DPHY โ DRAT โ DRATX โ DREM โ ENG โ FER โ GCL โ
โ โ String โ Int64 โ Int64 โ Int64 โ Int64 โ Int64 โ Int64 โ Int64 โ Int64 โ Int64 โ Int64 โ Int64โฐ โ Int64โฐ โ Int64โฐ โ Int64 โ Int64 โ Int64โฐ โ Int64โฐ โ Int64โฐ โ Int64โฐ โ Int64โฐ โ Int64โฐ โ Int64โฐ โ Int64โฐ โ
โโโโโโโโโโผโโโโโโโโโผโโโโโโโโโโโโโโโโผโโโโโโโโโโโผโโโโโโโโโโผโโโโโโโโผโโโโโโโโโผโโโโโโโโผโโโโโโโโโโผโโโโโโโโผโโโโโโโโผโโโโโโโโผโโโโโโโโโโผโโโโโโโโโผโโโโโโโโโผโโโโโโโโผโโโโโโโโผโโโโโโโโโผโโโโโโโโโผโโโโโโโโโโผโโโโโโโโโโผโโโโโโโโโผโโโโโโโโโโผโโโโโโโโโโผโโโโโโโโโค
โ 1 โ P โ 2013000000312 โ 6 โ 1 โ 700 โ 3 โ 1 โ 1061971 โ 10 โ 59 โ 1 โ missing โ 1 โ 2 โ 2 โ 2 โ 2 โ 2 โ missing โ missing โ 2 โ missing โ missing โ 2 โ
โ 2 โ P โ 2013000000776 โ 6 โ 2 โ 1400 โ 3 โ 1 โ 1061971 โ 6 โ 58 โ 1 โ missing โ 1 โ 2 โ 2 โ 2 โ 2 โ 2 โ missing โ missing โ 2 โ missing โ missing โ 2 โ
โฎ
โ 530507 โ P โ 2017001530497 โ 9 โ 1 โ 307 โ 4 โ 15 โ 1011189 โ 23 โ 35 โ 1 โ missing โ 1 โ 2 โ 2 โ 2 โ 2 โ 2 โ missing โ missing โ 2 โ missing โ missing โ 2 โ
โ 530508 โ P โ 2017001533163 โ 9 โ 1 โ 306 โ 4 โ 15 โ 1011189 โ 6 โ 63 โ 4 โ 1965 โ 6 โ 2 โ 2 โ 2 โ 2 โ 2 โ missing โ missing โ 2 โ 2 โ missing โ 2 โ
โ 530509 โ P โ 2017001533953 โ 9 โ 1 โ 305 โ 4 โ 15 โ 1011189 โ 7 โ 68 โ 4 โ 1998 โ 6 โ 2 โ 2 โ 2 โ 2 โ 2 โ missing โ missing โ 2 โ 1 โ missing โ 2 โ
Itโs not super fast on my machine (I didnโt measure), but it does the job in just a few minutes.