On my system, yes, it’s using AVX-512 instructions:
julia> @code_native debuginfo=:none count(a)
.section __TEXT,__text,regular,pure_instructions
movq (%rdi), %rax
movq 8(%rax), %rcx
testq %rcx, %rcx
jle L45
movq %rcx, %rdx
sarq $63, %rdx
andnq %rcx, %rdx, %rcx
movq (%rax), %rdx
cmpq $16, %rcx
jae L48
movl $1, %esi
xorl %eax, %eax
jmp L349
L45:
xorl %eax, %eax
retq
L48:
movabsq $9223372036854775792, %r8 ## imm = 0x7FFFFFFFFFFFFFF0
andq %rcx, %r8
leaq 1(%r8), %rsi
vpxor %xmm0, %xmm0, %xmm0
xorl %eax, %eax
movabsq $4607319040, %rdi ## imm = 0x1129E1C00
vmovdqa (%rdi), %ymm1
movabsq $4607319072, %rdi ## imm = 0x1129E1C20
vmovdqa (%rdi), %ymm2
vpxor %xmm3, %xmm3, %xmm3
vpxor %xmm4, %xmm4, %xmm4
vpxor %xmm5, %xmm5, %xmm5
vpxor %xmm6, %xmm6, %xmm6
nopw %cs:(%rax,%rax)
nopl (%rax)
L128:
vmovdqu (%rdx,%rax,8), %ymm7
vmovdqu 32(%rdx,%rax,8), %ymm8
vmovdqu 64(%rdx,%rax,8), %ymm9
vmovdqu 96(%rdx,%rax,8), %ymm10
vpand %ymm1, %ymm7, %ymm11
vpshufb %ymm11, %ymm2, %ymm11
vpsrlw $4, %ymm7, %ymm7
vpand %ymm1, %ymm7, %ymm7
vpshufb %ymm7, %ymm2, %ymm7
vpaddb %ymm11, %ymm7, %ymm7
vpsadbw %ymm0, %ymm7, %ymm7
vpaddq %ymm3, %ymm7, %ymm3
vpand %ymm1, %ymm8, %ymm7
vpshufb %ymm7, %ymm2, %ymm7
vpsrlw $4, %ymm8, %ymm8
vpand %ymm1, %ymm8, %ymm8
vpshufb %ymm8, %ymm2, %ymm8
vpaddb %ymm7, %ymm8, %ymm7
vpsadbw %ymm0, %ymm7, %ymm7
vpaddq %ymm4, %ymm7, %ymm4
vpand %ymm1, %ymm9, %ymm7
vpshufb %ymm7, %ymm2, %ymm7
vpsrlw $4, %ymm9, %ymm8
vpand %ymm1, %ymm8, %ymm8
vpshufb %ymm8, %ymm2, %ymm8
vpaddb %ymm7, %ymm8, %ymm7
vpsadbw %ymm0, %ymm7, %ymm7
vpaddq %ymm5, %ymm7, %ymm5
vpand %ymm1, %ymm10, %ymm7
vpshufb %ymm7, %ymm2, %ymm7
vpsrlw $4, %ymm10, %ymm8
vpand %ymm1, %ymm8, %ymm8
vpshufb %ymm8, %ymm2, %ymm8
vpaddb %ymm7, %ymm8, %ymm7
vpsadbw %ymm0, %ymm7, %ymm7
vpaddq %ymm6, %ymm7, %ymm6
addq $16, %rax
cmpq %rax, %r8
jne L128
vpaddq %ymm3, %ymm4, %ymm0
vpaddq %ymm0, %ymm5, %ymm0
vpaddq %ymm0, %ymm6, %ymm0
vextracti128 $1, %ymm0, %xmm1
vpaddq %xmm1, %xmm0, %xmm0
vpshufd $78, %xmm0, %xmm1 ## xmm1 = xmm0[2,3,0,1]
vpaddq %xmm1, %xmm0, %xmm0
vmovq %xmm0, %rax
cmpq %r8, %rcx
je L371
L349:
decq %rsi
L352:
xorl %edi, %edi
popcntq (%rdx,%rsi,8), %rdi
addq %rdi, %rax
incq %rsi
cmpq %rsi, %rcx
jne L352
L371:
vzeroupper
retq
nopw (%rax,%rax)