Vale ressaltar que entender que tipo de algorítimo está sendo aplicado pela ferramente em questão é bem relevante, esses "diffs" pronto costumam falhar mizeravelmente, recomendo uma leitura mais abrangente sobre o assunto: https://neil.fraser.name/writing/diff/myers.pdf.
Sobre a afirmativa: "Além disso, o BinDiff e seus amigos traduzem o Assembly original do binário para uma linguagem intermediária própria e comparam lógica, não instruções. " {Usando o sdk do IDA você consegue instrumentar o bindiff para aplicar alguns modelos de algoritmos de diferenciação em uma "instrução", o que está bem mais performático depois do último update, embora eu não use ele para realizar atividades mais complexas como diffing, existem alternativas melhores no r2 e se quiser graph, só usar xdot}